215 похожих чатов

Всех приветствую, такой вопрос - есть датасет из вопроса и

ответа в формате json
Некие данные чат диалога
Задача сделать трансформер чат бот что бы на основе этих данных можно было вести диалог

Вопрос такой, как можно представить датасет для обучения модели, принципиально ли разделять вопрос и ответ, какую архитектуру тогда использовать?
или в таком случаю достаточно будет привести к одному типу данные и получить корпус токенов и не важно где вопрос и ответ

6 ответов

15 просмотров

какой диалог вы хотите получить?

human- Автор вопроса

Болталку что бы поддержать разговор по типу -привет как дела -привет, хорошо

human
Болталку что бы поддержать разговор по типу -приве...

для этого трансформер не нужен. что бы отвечать на как дела и здороваться достаточно лесом пройтись. что бы сделать чат бота с нейросетями надо делать, что то сложное, способное: 1. классифицировать, что ему говорят 2. генерировать что то. но что бы чот генерировать адекватное, а не выбирать из набора вариантов, надо очень большой корпус. попробовать можно bert, он полегче gpt. но все равно думаю гигов 20 для дообучения модели надо. начнитн с подробной классификации текстов, с генераторами текстов я не работал.

human- Автор вопроса
Павел
для этого трансформер не нужен. что бы отвечать на...

класификация текста отвечает как бы за понимание контекста?

human
класификация текста отвечает как бы за понимание к...

ну да, о чем речь идет, выделять какие то сущности

human- Автор вопроса
Павел
ну да, о чем речь идет, выделять какие то сущности

если класификатор не использовать то будет херня?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта