Похожие чаты

Всем привет! есть группа текстов разделённая по темам, нужно для

каждой темы вытащить слова наиболее характеризующие каждую тему. Уверен что такую задачу уже решали миллион раз, мож есть какие готовые пайплайны? А то сходу не могу придумать что-то умнее чем применить лемметизацию\стеммер, выкинуть стопслова и посчитать топ слов по количеству по темам..

4 ответов

8 просмотров

А почему бы и нет?

Простой вариант: from rutermextract import TermExtractor term_extractor = TermExtractor() list_theme = [] for term in term_extractor(text): list_theme.append(term.normalized) theme_text = ' | '.join(list_theme[:3])

Можно взять feature importance у простых или деревянных моделей, из классификатора

а в рамках безумной идеи глянуть например на фиче импотенс рандом фореста?

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Hey, Oceaners 🌊 As we approach Phase 1 of the token merger, OCEAN and AGIX will migrate to FET starting July 1st! Here's a list of exchanges that have communicated their su...
KreigDK | Never DM first🌊
3
VIP 332 Quarterly XVS Buyback, Funds Allocation and New Tokenomics Summary This VIP outlines the protocol’s Quarterly Buyback and Funds Allocation strategy as per our Tokeno...
Venus Announcements
1
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
I love the passion, really do. I do think this is being blown way out of proportion. We are not deleting our Telegram or not allowing you to talk about anything you want, a...
Mike Herron
3
Did you guys see the latest tweet from TonGifts? 🚀
Mike
44
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Hey, what is the best and maintained way of transpiling cpp to c? (As a need to support many different toolchains quickly and may not have a c++ support in the given toolch...
Meitar Reihan
11
Hey guys, did you see the latest announcement about $FUN? 🔥
Brian
21
Карта сайта