документов, такие же датасеты, какие использовал Илья, для обучения Сайги, то такая модель ведь будет более-менее годно консультировать по содержанию этого массива документов? Ну, вроде как "модель-юрист" например, или вроде того. Это ведь возможно в принципе? @YallenGusev а сколько примерно вычислительных ресурсов уходит на подобное дообучение? Очень приблизительно если.
но только этот массив документов нужно представить в форме вопрос-ответ или сначала обучить на массиве текстов, а потом ещё и на инструкциях/qa это возможно, но едва ли нужно от размера корпуса зависит, от пары часов до пары дней RTX3090
Это не будет работать
почему? Сайга же работает.
Сайга это не QA по документам. Я и Давид объяснили выше
ну так она не "не QA по документам" потому что ее этому не учили 🤷♀️ кто-нибудь вообще делал подобное? обучал модель большим массивам текстов таким образом? откуда уверенность что не работает? я не спорю - мне просто хочется иметь достоверные данные.
Насчёт уверенности - если бы это работало, так бы делали во всем мире
поставьте эксперимент и расскажите нам - будет полезно я думаю
Обсуждают сегодня