170 похожих чатов

Всем салют! Видел ли кто нибудь статьи или блогпосты или туториалы

по файнтюну Flan T5 или других инструкт-моделей?

Пытаюсь понять, как лучше при тюнинге добавлять in-context примеры и промпт. Имеет ли смысл делать промпт большим и вообще добавлять примеры, если есть тюнинг? Модель так и так данные + задачу выучивает, кажется, ну а вдруг. Или например сделать 10 разных промптов и с ними тюнить, и мб так будет полезно.

14 ответов

4 просмотра

Ничего добавлять не надо. Файнтюнится она как любая Seq2Seq модель. Пример кода обучения: https://github.com/Den4ikAI/FRED-T5-Finetuning

See-All Автор вопроса
datascience xc
Ничего добавлять не надо. Файнтюнится она как люба...

вопрос не в коде обучения, а в способах получить от одной модели больше на том же наборе данных за счёт того, что это не обычная seq2seq модель, а инструкт. Если бы "ничего доблавтяь не надо было", то p-tuning бы никогда не появился

See All
вопрос не в коде обучения, а в способах получить о...

Ну во-первых файнтюнинг и p-tuning разные вещи. Во время p-tuninga мы не обучаем саму модель, а только подбираем промпт.

See All
вопрос не в коде обучения, а в способах получить о...

Так флан буст получает от мультитаска с инструкциями. Никто не гарантирует, что SFT с инструктом сработает лучше, чем он же без инструкта, если там всего одна задача.

See All
вопрос не в коде обучения, а в способах получить о...

Разнообразных данных надо, чем больше, тем лучше, тогда почти гарантированно будет буст качества

See-All Автор вопроса
datascience xc
Ну во-первых файнтюнинг и p-tuning разные вещи. Во...

разные вещи, и...что? Я использую один пример как демонстрацию того, что тюнинг "промпта" имеет смысл в контексте задачи

See-All Автор вопроса
Daniil
Так флан буст получает от мультитаска с инструкция...

Никто не гарантирует и обратного, и именно поэтому я задаю вопрос - экспериментировал ли кто-то? Даёт ли это буст? При каких условиях? А ещё в вопросе пть часть про in-context примеры, что точно отличает подход от sft

See-All Автор вопроса
Daniil
Разнообразных данных надо, чем больше, тем лучше, ...

Спасибо, я это понимаю. А по исходному вопросу будет какая то информация?

Вы хоть знаете что такое p-tuning?

See All
разные вещи, и...что? Я использую один пример как ...

Делайте датасет разнообразнее и больше. Будет вам счастье

See-All Автор вопроса

Мб все же есть у кого реальные кейсы по тюнингу flan с примерами?

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
Делаю велосипед логгер. К сообщению хочу прикрутить некоторую информацию, типа, кем отправлено, какой уровень, и всякое такое. И тут подумалось мне, почему бы не хранить весь...
Serjone
24
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
64
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
а не подскажете вот это скрин из какой IDE ?
Iluha Companets
10
Народ всем привет Подскажите, как включить самописные dll библиотеки в итоговую сборку Сейчас при запуске dev сервера локально формируется папка build, из которой запускается...
Андрей
4
Комрады, подскажите, в дельфях есть компоненты а-ля TDirectorySelect?
Ed Doc
15
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
Доброе утро! Не совсем понятно как установить счетчик яндекс метрики на сайт. И потом ещё цели проставить?
Евгения
18
Карта сайта