развития - научиться управлять и ограничивать ответы. Вот как они делают так, чтобы модель считала некоторые темы плохими?
Думаю, примерно так же, как они заставляют выбирать её интересными — разметка специальной выборки "этическими активистами" какими-нибудь, а потом дообучение (как это уже в ней сделано для выдачи интересных ответов)
В моем случае я нашел прям откровенные косяки. Выяснил, что код R она гоняет по онлайн платформам. Я выяснил у нее список этих платформ. Прошу прогнать код на одной из них - я получаю один результат, она - другой
Вопрос на засыпку: можно ли сделать небольшой размеченный датасет, при помощи него ткнуть в точку в лейтент спейсе, и там решить, что все точки вокруг указанной == плохо
Там можно найти инфу по тому, какая у неё целевая функция (либо лосс), где-то видел, что там встроена комбинация из двух свойств, второе это "интересность" вопроса, а первое уже не помню, мб что-то близкое к точности или ёмкости ответа
Так, я напутал, это из lamda, которая у гугла, но вполне возможно, что подход схож
Обсуждают сегодня