терминов из коротких текстов специфичного домена?
LDA не показало интерпретируемого результата
Любая помощь советом по улучшению качества из опыта или что можно почитать - приветствуется 🙂
Если вам нужно извлечение ключевых слов из текста, то: 1. Есть классические алгоритмы типа RAKE / YAKE 2. Недавно опубликовали модельку по извлечению ключевых слов: https://habr.com/ru/post/599715/
YAKE/RAKE тоже пробовала Т5 посмотрю, спасибо
Можно попробовать ещё разбить текст на какие-нибудь n-грамы и косинусным расстоянием сравнить их эмбеддинги с эмбеддингом всего текста, выбрать те, у которых скор будет выше. Ну, это так, идея...)
Я об этом тоже думала, но вот не уверена тем, как построить эмбединги. Бертом ?
Обсуждают сегодня