170 похожих чатов

Всем привет,объясните, пожалуйста, есть ли смысл стоить embedding-ги при

помощи:


- TF-IDF
- Word2Vec CBOW
- GloVe

если есть берты которые не только слова по отдельности представят в числовом виде, а и attention юзают блгодаря чему сохраняют связь между словами что позволяет вычленить гараздо больше инфы с текста.К примеру те же sentance transformers

В чем смысл юзать что либо иное?

- TF-IDF вообще только релевантность слов считает в рамках предложения, но никак не имитирует смысл слов и их связь.

(исходя из моего понимания,поправьте,пожалуйста, если я не прав)

- Word2Vec CBOW так то учитывает контекст, но attention для этого лучше,ИМХО.Смысл в этом подходе?

- GloVe (uses the semantic relationship between the words is obtained using a co-occurrence matrix)

тоже казалось бы как-то слова связывает между собой, но это все еще не attention.

Вопрос: зачем их юзают, и стоит ли в них углубляться если есть берты?

10 ответов

39 просмотров

Предполагаю что основная причина в том, что attention очень дорого считать, поправьте, если ошибаюсь

единственный повод считать эмбеддинги чем-то кроме берта - это то, что TF-IDF заведётся на микроволновке, а берт нет

TF-IDF хорошо ловит мусор, опечатки и тп., т.к. считает их очень важными из-за редкого употребления. Ну и ключевые слова (тэги) можно до кучи

Gleb-Maksimov Автор вопроса
Ilya Shigabeev
единственный повод считать эмбеддинги чем-то кроме...

но там же он не особо много инфы вычленит, толку 0 почти же, или я не прав?

Gleb Maksimov
но там же он не особо много инфы вычленит, толку 0...

ещё как вычленит. Языки всегда сложно моделировать

Gleb-Maksimov Автор вопроса
Ilya Shigabeev
А какая задача, напомни?

та любая, от text-classification до text-generation

Gleb-Maksimov Автор вопроса

ну конкретно сейчас текст классифицирую)

Gleb Maksimov
ну конкретно сейчас текст классифицирую)

Я бы сделал baseline на tfidf за пару часов со стеммингом, и если качество оказалось бы ниже приемлемого, ковырял бы bert

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
открыть папку в проводнике: 1 - ShellExecute 2 - ExecuteProcess 3 - OpenDocument что лучше выбрать?
Alexey Kulakov
12
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, стандартный ;вызов процедуры ;option casemap:no...
Егор Анелькин
1
Добрый день подскажите пожалуйста может кто то сталкивался с ошибками Sentry 22.10.0 развернутым из helm чарт в Kubernetes? Изначально 3 дня назад очень стало много событий ух...
Tire4 Finist Devops
1
Карта сайта