Друзья, GPT-4 клянется и божится всеми своими предками (я два

Question

Друзья, GPT-4 клянется и божится всеми своими предками (я два

раза переспросил), что файнтюнинг - это оптимальный метод, чтобы научить Llama консультировать по какому-то БОЛЬШОМУ объему документов (ну, например, сборнику федеральных законов, или вроде того). Но так ли это в действительности? И второй вопрос тогда: а во сколько обойдется такой проект? Ну, +-. Если именно путем файнтюнинга пойти, и обучать, скажем, Saiga 30B. Хотя бы порядок цифр. Особенно интересно мнение @abdullin 😊

#nlp #programming #russian

0

18.07.2023

22 ответов

40 просмотров

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

datascience xc
1. Обучение на документах не даст возможности конс...

То есть все-таки ретривер нужен непременно, да? Скажи, я правильно понял смысл, что мы весь массив документации режем на куски, затем перегоняем куски в эмбеддинги, кладем в векторную БД, запрос затем тоже переводим в эмбеддинг, ищем наиболее релевантные куски, эти куски склеиваем, и вместе с запросом даем модели, чтобы она офрмила это в виде внятного ответа, так?

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

datascience xc
1. Обучение на документах не даст возможности конс...

...но как же тогда Сайга? Ее ведь научили русскому именно с помощью файнтюнинга, и это работает. Так? Или это как-то иначе было? Что именно я упускаю в своих выкладках?

0

18.07.2023

Ilya Gusev

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
...но как же тогда Сайга? Ее ведь научили русскому...

Сайгу научили не русскому, а следованию русским инструкциям. Ллама сама по себе довольно хороша в русском, по крайней мере на уровне внутренних представлений

0

18.07.2023

David Dalé

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
...но как же тогда Сайга? Ее ведь научили русскому...

Есть разница между тем, чтобы научиться языку (то есть набору слов и тому, как их складывать в грамматичные предложения) и набору фактов (позволяющему дальше непротиворечиво и без излишней фантазии отвечать на вопросы по этим фактам). С первым языковые модели после (до)обучения справляются хорошо (поэтому их так и называют!), а со вторым у них туго, поэтому им в помощь и дают костыли в виде ретриверов.

0

18.07.2023

᠌Vladimir Gurevich

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
То есть все-таки ретривер нужен непременно, да? Ск...

да именно так, можно тот же попсовый langchain посмотреть как работает (или haystack), - почему так , есть много причин. одна из них, большие модели несильно быстрые, нужно сузить количество документов (попробуйте запустить LLM над 100_000 документами). во-вторых LLM много чего умеют, особенно из инструкций, и в zero-shot settings, но они довольно плохо оперируют фактическими данными : их "знания" ограничены на момент претрейнинга (хотя есть исследования как делать factual injection), а во-вторых у них довольно плохо все с recall (ибо не в этом их цель изначальная), т.е. для QA по фактическим документам , нужно условно быстрыми методами с хорошим recall , сузить scope, затем из полученных создать контекст и промт и подсунуть таким моделям.

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

Ilya Gusev
Сайгу научили не русскому, а следованию русским ин...

Илья, а можно для тупых: что значит "следованию русским инструкциям"? Ей на вход что именно подавалось и в каком виде? 🙏

0

18.07.2023

datascience xc

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
Илья, а можно для тупых: что значит "следованию ру...

Это значит, что ты ей говоришь: придумай 10 названий для парикмахерской и она придумывает

0

18.07.2023

Ilya Gusev

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
Илья, а можно для тупых: что значит "следованию ру...

вот тут все максимально подробно описано: https://github.com/IlyaGusev/rulm/blob/master/self_instruct/src/data_processing/create_chat_set.py

0

18.07.2023

datascience xc

Ilya Gusev
вот тут все максимально подробно описано: https://...

И что из этого кода должен извлечь человек? Вы не ошиблись ссылкой?

0

18.07.2023

Ilya Gusev

datascience xc
И что из этого кода должен извлечь человек? Вы не ...

нет, извлечь названия датасетов и формт

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

datascience xc
Это значит, что ты ей говоришь: придумай 10 назван...

а почему она и так не может этого сделать, коли "Ллама сама по себе довольно хороша в русском, по крайней мере на уровне внутренних представлений"? я хочу понять суть отличия между одним и другим.

0

18.07.2023

datascience xc

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
а почему она и так не может этого сделать, коли "Л...

Потому что ее учили продолжать текст

0

18.07.2023

datascience xc

datascience xc
Потому что ее учили продолжать текст

Если ламе написать "напиши сочинение как я провел лето", то она продолжит "Сочинение должно быть 150 слов" и т.д

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

Ilya Gusev
вот тут все максимально подробно описано: https://...

Да, спасибо, теперь понятнее. Илья, я правильно понимаю, что модель после такого обучения, получая инструкцию, "ищет внутри себя" (условно говоря, я понимаю что оно иначе работает) наиболее векторно близкую к одной из инструкций данных датасетов, и генерит ответ по образу и подобию ответа для данной инструкции из данного же датасета? Принцип такой, да?

0

18.07.2023

Ilya Gusev

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
Да, спасибо, теперь понятнее. Илья, я правильно по...

Скорее нет, чем да. Это хорошо обобщается и на новые инструкции, поэтому модель скорее учит сам принцип следования инструкциям

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

Ilya Gusev
Скорее нет, чем да. Это хорошо обобщается и на нов...

В таком случае зачем ей именно русские инструкции?

0

18.07.2023

Ilya Gusev

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
В таком случае зачем ей именно русские инструкции?

потому что запросы - русские инструкции

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

...ааа, то есть Llama изначально вообще не очень именно в следовании инструкциям, да? И ее приходится дообучать именно на таких парах?

0

18.07.2023

datascience xc

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
...ааа, то есть Llama изначально вообще не очень и...

Да

0

18.07.2023

Ilya Gusev

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
...ааа, то есть Llama изначально вообще не очень и...

Ллама обучалась продолжать текст. Следование инструкциям != продолжению текста

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

Ilya Gusev
Ллама обучалась продолжать текст. Следование инстр...

Все, пазл сложился!)) Спасибо большое! 🙏

0

18.07.2023

datascience xc · Accepted Answer

1. Обучение на документах не даст возможности консультировать по ним (+ ещё галлюцинации) 2. Обучать модель НЕ нужно, нужно взять ретривер, скормить ему документы, взять модель которая будет получать вывод из ретривера и давать ответ (например: https://huggingface.co/Den4ikAI/FRED-T5-LARGE_text_qa).

170 похожих чатов

Друзья, GPT-4 клянется и божится всеми своими предками (я два

22 ответов

Похожие вопросы