...Так, ну а если, допустим, создать на основе некоего массива

Question

...Так, ну а если, допустим, создать на основе некоего массива

документов, такие же датасеты, какие использовал Илья, для обучения Сайги, то такая модель ведь будет более-менее годно консультировать по содержанию этого массива документов? Ну, вроде как "модель-юрист" например, или вроде того. Это ведь возможно в принципе? @YallenGusev а сколько примерно вычислительных ресурсов уходит на подобное дообучение? Очень приблизительно если.

#nlp #programming #russian

0

18.07.2023

9 ответов

53 просмотра

datascience xc

Это не будет работать

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

datascience xc
Это не будет работать

почему? Сайга же работает.

0

18.07.2023

datascience xc

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
почему? Сайга же работает.

Сайга это не QA по документам. Я и Давид объяснили выше

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

datascience xc
Сайга это не QA по документам. Я и Давид объяснили...

ну так она не "не QA по документам" потому что ее этому не учили 🤷‍♀️ кто-нибудь вообще делал подобное? обучал модель большим массивам текстов таким образом? откуда уверенность что не работает? я не спорю - мне просто хочется иметь достоверные данные.

0

18.07.2023

datascience xc

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
ну так она не "не QA по документам" потому что ее ...

Насчёт уверенности - если бы это работало, так бы делали во всем мире

0

18.07.2023

Ilya Gusev

datascience xc
Насчёт уверенности - если бы это работало, так бы ...

но так и делают

0

18.07.2023

Roman V

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru
ну так она не "не QA по документам" потому что ее ...

поставьте эксперимент и расскажите нам - будет полезно я думаю

0

18.07.2023

🅿️🅾️Ⓜ️🅰️♓️🈴 romad.ru Автор вопроса

datascience xc
Насчёт уверенности - если бы это работало, так бы ...

логично

0

18.07.2023

Ilya Gusev · Accepted Answer

Ilya Gusev

но только этот массив документов нужно представить в форме вопрос-ответ или сначала обучить на массиве текстов, а потом ещё и на инструкциях/qa это возможно, но едва ли нужно от размера корпуса зависит, от пары часов до пары дней RTX3090

0

18.07.2023

170 похожих чатов

...Так, ну а если, допустим, создать на основе некоего массива

9 ответов

Похожие вопросы