170 похожих чатов

Коллеги, подскажите насчёт применимости Domain Adaptation через MLM для task-specific

моделей с HF? Есть смысл или модель основной навык забывать начнёт?

6 ответов

18 просмотров

А как предполагается это делать?

Max-Ermakov Автор вопроса
E E
А как предполагается это делать?

Ну, у нас модель из двух кусков - энкодер, который зачастую учили на MLM, и какая-то task-specific надстройка. Я думаю можно было бы на время переставить энкодер в MLM, потюнить на новых данных, а затем вернуть task-specific часть. Вот интересуюсь, какие подводные камни.

Выглядит как один из возможных подходов. Я бы еще пробовал сначала доменно адаптировать как mlm, затем обучать голову на нужную задачу (Если данные из другого домена, возможно, стоит фризить все или часть слоев энкодера, чтобы назад не деадаптировался он.

Max-Ermakov Автор вопроса
E E
Выглядит как один из возможных подходов. Я бы еще ...

О, вот про фризить я вообще не подумал, ибо опыта такого небыло. Моя хитрая задумка вообще - поожидать улучшения качества не дообучая на своих данных под задачу (разметки нет) 😏

Так данных для основной задачи нет вроде как..

E E
Так данных для основной задачи нет вроде как..

Ну учили же task-specific голову на чём-то?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта