215 похожих чатов

Ребят, возник вопрос по задачам NLP в целом. Я правильно

понимаю, что мы в целом обучаем связку 2-х алгоритмов: это векторизатор текста и алгоритм машинного обучения. И векторизатор не должен знать про данные для теста. По итогу мы тестим не одну модель, а как раз ту связку ветокризатор + мл. Я верно всё понимаю ?

6 ответов

15 просмотров

разные схемы могут быть. Для самых простых векторизаторов типа bag of words и TF-IDF фактически обучение не нужно, это просто сбор статистики. Если использовать эмбеддинги, можно брать уже готовые. А можно встроить эмбеддинг в модель, и тогда они обучаются вместе.

Vitaliy-Baldeev Автор вопроса
Roman Nm
разные схемы могут быть. Для самых простых вектори...

Вот только и bow и tf-idf собирают статистику по всему корпусу текстов. То есть их векторизации будут отличаться немного.

Нейронка нейронке рознь. В нейронку можно уже готовый эмбеддинг подавать.

Да, а для трансформеров, кстати, совместно обучаются токенизатор, эмбеддинг токенов и модель. Но инферятся отдельно токенизатор и отдельно всё остальное.

Roman Nm
Да, а для трансформеров, кстати, совместно обучают...

в смысле токенизатор одновременно с моделью обучается? токенизатор обучается до

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Всем привет! вывожу на общей стр дочерние ресурсыв каждом ресурсе галерея, и первая фотка должна выводиться на общей [!DocLister? &prepare=photo !]
Alekso
12
А можно вопрос? Мне сегодня сказали что у меня функция (которая просто заполняет массив значениями) не правильная void Full(double * arr, int n) { for (int i = 0; i < n; i...
† C E †
7
День добрый, подскажите пожалуйста, есть ли какой-то способ сказать ребару не компилировать определённое приложение? Всю доку их перечиатл ничего подобного не нашёл
Кирилл
14
Добрый вечер. Хочу чтобы у меня в классе поле было функцией, которая возвращает строку. Делаю так: interface ... TGetOutPath = function : String of object; ... protec...
Kirill Filippenok
12
Народ! Впервые клиенту пришло письмо от РКН, у вас, дескать, есть яндекс метрика, а нигде не написано, что вы ее юзаете. Никто не сталкивался?
Sasha Beep
14
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Здравствуйте, хочу сделать HelloWorld в консоли Дельфи, но функция API ничего не выводит, что я делаю не так? program Hello; {$APPTYPE CONSOLE} uses System.SysUtils, WinAPI.Wi...
Sergey Vinogradov
20
Карта сайта