215 похожих чатов

Всех приветствую, такой вопрос - есть датасет из вопроса и

ответа в формате json
Некие данные чат диалога
Задача сделать трансформер чат бот что бы на основе этих данных можно было вести диалог

Вопрос такой, как можно представить датасет для обучения модели, принципиально ли разделять вопрос и ответ, какую архитектуру тогда использовать?
или в таком случаю достаточно будет привести к одному типу данные и получить корпус токенов и не важно где вопрос и ответ

6 ответов

3 просмотра

какой диалог вы хотите получить?

human- Автор вопроса

Болталку что бы поддержать разговор по типу -привет как дела -привет, хорошо

human
Болталку что бы поддержать разговор по типу -приве...

для этого трансформер не нужен. что бы отвечать на как дела и здороваться достаточно лесом пройтись. что бы сделать чат бота с нейросетями надо делать, что то сложное, способное: 1. классифицировать, что ему говорят 2. генерировать что то. но что бы чот генерировать адекватное, а не выбирать из набора вариантов, надо очень большой корпус. попробовать можно bert, он полегче gpt. но все равно думаю гигов 20 для дообучения модели надо. начнитн с подробной классификации текстов, с генераторами текстов я не работал.

human- Автор вопроса
Павел
для этого трансформер не нужен. что бы отвечать на...

класификация текста отвечает как бы за понимание контекста?

human
класификация текста отвечает как бы за понимание к...

ну да, о чем речь идет, выделять какие то сущности

human- Автор вопроса
Павел
ну да, о чем речь идет, выделять какие то сущности

если класификатор не использовать то будет херня?

Похожие вопросы

Обсуждают сегодня

Интересно, нет ли какого-то способа получить из dll не адрес самой метки, а адрес со смещением?
The Bird of Hermes
54
generic procedure function test<T>(param: T); type case T of longint: NewT = word; longword: NewT = byte; end; var v1: NewT; Как это можно сделать? Чтобы у меня...
notme
21
Делал задачу вот такую https://stepik.org/lesson/4985/step/9?unit=1083 получилось такое https://play.haskell.org/saved/ipKrepqe оно работает, тестов много не писал, но работае...
Fedor
22
Хотел уточнить: копирование из одного рекорда в другой однотипный рекорд можно только по полям отдельно или можно чохом, типа Assign?
Ed Doc
9
Похоже опять туплю задача https://stepik.org/lesson/5431/step/8?unit=1132 код и его работа https://play.haskell.org/saved/lmYTShXM на мой взгляд все правильно, и даже избыто...
Fedor
8
Sometimes I like to solve problems the hard way. What do I mean? You know many problems can be fixed by restarting the system, but how much do you learn about the system? P...
Matthias Hoffmann
1
что-то я не понимаю, в линуксе отладочную информацию как убрать из бинаря? он что с этой опцией, что без - одного и того же (достаточно большого) размера (да, я про лазарь)
Iluha Companets
13
Anyone here suffers from unexplained aural migraines, who would be up for talking for a bit? Doesn't *have* to be aural, but I am not asking about headaches, I mean actual mi...
Martin Rys
58
Hey Does anyone know how can I receive push notifications from Github on my account? The official Github android app doesn't send notifications, and I don't use the email bec...
Jacob
10
Приветствую почтенную публику. nimble install nimx в самом конце даёт: Downloading https://github.com/guzba/zippy using git Tip: 56 messages have been suppressed, use...
Академия Связи
1
Карта сайта