170 похожих чатов

Всем привет! Хочу решить задачу для Q&A с использованием LLM,

хотел узнать какие подходы для решения уже существуют.
Есть у кого был опыт?
Для контекста, условно есть документ на n предложений (например, конституция/свод правил), и хочется, чтобы модель отвечала на вопрос по документу
Пример:
Вопрос: Я ушел из магазина не заплатив за хлеб, что будет мне за это?
Ответ: Это статья такая-то такая-то, Вам может грозить а, б, в, г итд итп

9 ответов

16 просмотров

Скормите ЛЛМ сам вопрос и простыню документа, с инструкцией: смотри при ответе на вот этот фрагмент

Temirlan- Автор вопроса
Konstantin Galagan
Скормите ЛЛМ сам вопрос и простыню документа, с ин...

На моем железе у меня контекст выше 512 не помещается, боюсь весь документ может не влезть. Слышал про идею, где мы конкатенируем эмбеддинг документа/его частей в инпут с промптом, и потом уже генерим на этой же основе

Temirlan- Автор вопроса
Konstantin Galagan
Скормите ЛЛМ сам вопрос и простыню документа, с ин...

А какая средняя длина документов у Вас была? В токенах, если посчитать, и какой контекст влазил в Ваших экспериментах?

Могу рассказать исходят из опыта работы с эмбеддингами openai, там вроде есть какие модели получше, но не сильно 53 балла против 55. Эмбеддинги в приведенном кейсе вообще не помогут, если вы не хотите сильно раздувать длину промпта. Есть вероятность, что они вообще не будут работать в приведенном кейсе. Вам нужно тестировать. Почему мне видится, что эмбеддинги не ваш подход: 1. статей ук очень много, они довольно длинные и подставлять 6-7 статей в надежде на то, что попадется нужная – так себе. Да и чем больше контекстов – тем хуже они будут находится. 2. «я ушел из магазина не заплатив за хлеб» – эмбеддинги не найдут статьи о краже, они даже не будут знать о том, что хлеб стоит менее 3к рублей. Они будут искать хлеб, магазин и неоплату. Если конкретно говорить о УК и снижать кол-во галлюцинаций, то нужно обучить модельку выдавать вам по описание какие УК подходят, а уже в другую модельку подставлять нужные статьи для ответа. Если такой точности не хватит, то можно попробовать сделать так: модель выдала вам статьи, вы взяли эмбеддинги этой статьи и нашли еще 1-3 похожие и засунули их дополнительно в LLM, которая будет отвечать. Особо не шарю – можно ли дообучить эмбеддинги именно на такой выборке. Т.е. нужен датасет вопрос – статья, в любом случае.

Temirlan- Автор вопроса
Bletusmanov
Могу рассказать исходят из опыта работы с эмбеддин...

Понял, спасибо. Пример с хлебом, наверное был слишком далёким, в реальности будет, что документ это FAQ, и соответственно хочется отвечать по частым вопросам в FAQ, причем вопросы могут быть не самыми очевидными. Правильно понял, по запросу и условной модели классификации будем находить n ближайших статей по смыслу, их эмбеддинг потом будем подавать как контекст для ответа?

Temirlan
Понял, спасибо. Пример с хлебом, наверное был слиш...

Найденный по эмбеддингу текст подаём как контекст

Temirlan
Понял, спасибо. Пример с хлебом, наверное был слиш...

Все так, в целом это даже может поможет помочь не дообучать модель каждый раз когда выходит новый закон(но только если он похож на старый).

Temirlan
Понял, спасибо. Пример с хлебом, наверное был слиш...

Если дадите более четкий пример вашего FAQ, то скажу точнее. Но в таком описании эмбеддингов вам хватит.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта