169 похожих чатов

Всем добрый вечер! Есть ли у кого-нибудь опыт transfer learning

BERT-a в адаптации на доменные тематики текстов?

10 ответов

24 просмотра

привет! вы имеете в виду fine tuning на собственном датасете? или что-то другое?

Екатерина- Автор вопроса

Надо решить задачу классификации на текстах доменной тематики, перенять опыт scibert Насколько я поняла из анализа литературы, ru-Bert был получен трансфером, не обучением с нуля

Да, диппавловский руберт делали из мультиязычного модификацией словаря и дообучение на русских корпусах. Я в этом году проделывал аналогичную работу с маленьким rubert-tiny.

Екатерина- Автор вопроса

Поскажите, пожалуйста, (я запуталась в туториалах и скриптах трансформеров) надо отдельно создать новый словарь, отдельно тренировать LM, а потом ещё модифицировать слои в Bert? Остались ли у Вас источники, которыми Вы пользовались?

В простейшем случае можно ничего специально не модифицировать, а просто дообучить все веса нейронки на текстах из своего домена. Говорят, это само по себе на несколько пунктов качество растит. Если очень хочется, можно и словарь обновить, добавив побольше токенов. У меня для этого готовых скриптов нет, но можно взять блокнот из статьи про rubert-tiny (https://habr.com/ru/post/562064), где я делаю противоположную вещь - сокращаю словарь, выкидывая малоиспользуемые токены.

Екатерина- Автор вопроса

Я сейчас, возможно, глупо задам вопрос, но дообучить веса - это продолжить предобучение или файнтюнинг/настройка просто на текстах ?

Я вообще не вижу разницы между файнтюнингом и продолжением предобучения) Этапов обучения может быть сколько угодно.

Прикольно, думал, что его с нуля обучали. В таком случае, если есть потребность файнтюнить модель для рус+англ+франц, то лучше брать rubert, а не классический multilingual?

Нет, не лучше. Из словаря rubert выкинули токены, редко используемые в русском языке, поэтому другие языки он описывает хуже. Я в своем rubert-tiny оставил много как русских, так и английских токенов, но с французским и другими языками будут проблемы.

спасибо!

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
что насчет пагинга? на осдеве непонятно(
Vi Chapmann 🪙
26
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
64
Ребят, что лучше для реверса: гидра или ида?
En Vind Av Sorg
26
Делаю велосипед логгер. К сообщению хочу прикрутить некоторую информацию, типа, кем отправлено, какой уровень, и всякое такое. И тут подумалось мне, почему бы не хранить весь...
Serjone
24
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
если загрузчик efi? если сама PML4 PDPT PDT PT лежит в неудобном для меня месте?
Vi Chapmann 🪙
8
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Карта сайта