215 похожих чатов

Всех приветствую, такой вопрос - есть датасет из вопроса и

ответа в формате json
Некие данные чат диалога
Задача сделать трансформер чат бот что бы на основе этих данных можно было вести диалог

Вопрос такой, как можно представить датасет для обучения модели, принципиально ли разделять вопрос и ответ, какую архитектуру тогда использовать?
или в таком случаю достаточно будет привести к одному типу данные и получить корпус токенов и не важно где вопрос и ответ

6 ответов

12 просмотров

какой диалог вы хотите получить?

human- Автор вопроса

Болталку что бы поддержать разговор по типу -привет как дела -привет, хорошо

human
Болталку что бы поддержать разговор по типу -приве...

для этого трансформер не нужен. что бы отвечать на как дела и здороваться достаточно лесом пройтись. что бы сделать чат бота с нейросетями надо делать, что то сложное, способное: 1. классифицировать, что ему говорят 2. генерировать что то. но что бы чот генерировать адекватное, а не выбирать из набора вариантов, надо очень большой корпус. попробовать можно bert, он полегче gpt. но все равно думаю гигов 20 для дообучения модели надо. начнитн с подробной классификации текстов, с генераторами текстов я не работал.

human- Автор вопроса
Павел
для этого трансформер не нужен. что бы отвечать на...

класификация текста отвечает как бы за понимание контекста?

human
класификация текста отвечает как бы за понимание к...

ну да, о чем речь идет, выделять какие то сущности

human- Автор вопроса
Павел
ну да, о чем речь идет, выделять какие то сущности

если класификатор не использовать то будет херня?

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Ребят в СИ можно реализовать ООП?
Николай
33
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Карта сайта