ответа в формате json
Некие данные чат диалога
Задача сделать трансформер чат бот что бы на основе этих данных можно было вести диалог
Вопрос такой, как можно представить датасет для обучения модели, принципиально ли разделять вопрос и ответ, какую архитектуру тогда использовать?
или в таком случаю достаточно будет привести к одному типу данные и получить корпус токенов и не важно где вопрос и ответ
какой диалог вы хотите получить?
Болталку что бы поддержать разговор по типу -привет как дела -привет, хорошо
для этого трансформер не нужен. что бы отвечать на как дела и здороваться достаточно лесом пройтись. что бы сделать чат бота с нейросетями надо делать, что то сложное, способное: 1. классифицировать, что ему говорят 2. генерировать что то. но что бы чот генерировать адекватное, а не выбирать из набора вариантов, надо очень большой корпус. попробовать можно bert, он полегче gpt. но все равно думаю гигов 20 для дообучения модели надо. начнитн с подробной классификации текстов, с генераторами текстов я не работал.
класификация текста отвечает как бы за понимание контекста?
ну да, о чем речь идет, выделять какие то сущности
если класификатор не использовать то будет херня?
Обсуждают сегодня