Всем привет, задам, наверное, немного нубский вопрос. Допустим, языковая модель

Question

Всем привет, задам, наверное, немного нубский вопрос. Допустим, языковая модель

генерирует какой-то текст пользователю и пользователь оценивает качество сгенерированного текста (правильно/неправильно). Каким образом можно дообучить модель, чтобы она старалась выдавать пользователю именно правильный текст? Насколько я понял, обычный BERT дает возможность решать задачу классификации, но применимо ли оно в такой задаче?

#nlp #programming #russian

0

28.06.2022

4 ответов

22 просмотра

Денис Лазаренко Автор вопроса

David Dalé
Можно с помощью RL попробовать, как тут: https://o...

Понял, спасибо

0

28.06.2022

Dmitriy

пользователь же оценивает если модель то почитайте про перплексию

0

29.06.2022

Денис Лазаренко Автор вопроса

Dmitriy
пользователь же оценивает если модель то почитайт...

спасибо, почитаю. звучит как что-то очень близкое к моей задаче

0

29.06.2022

David Dalé · Accepted Answer

David Dalé

Можно с помощью RL попробовать, как тут: https://openai.com/blog/learning-to-summarize-with-human-feedback/ Ну или просто генерировать языковой моделью несколько вариантов, а бертом отбирать наиболее привлекательный.

0

28.06.2022

170 похожих чатов

Всем привет, задам, наверное, немного нубский вопрос. Допустим, языковая модель

4 ответов

Похожие вопросы