215 похожих чатов

Добрый день. Что можно делать с сообщениями из чатов? Я

имею в виду помимо частотного анализа , можно же сделать какой-то NLP и тп. Посоветуйте пожалуйста, не могу придумать.
Например делаю маркетинговый анализ для ниши тортов, нахожу тематические чаты, получаю 1м+ сообщений и что?

2 ответов

17 просмотров

я бы начал всё таки с частотного и с формулировки задачи. А так вытащить можно много всего, например инты и всё что вокруг них с ограничениями в виде символов пунктуации, какие то определенные слова-маркеры интересующие вас и т.д.

std::divconq- Автор вопроса
Антон Дорохов
я бы начал всё таки с частотного и с формулировки ...

Привет, спарсил чат ВМК, прошёлся регуляркой /w+ и получил корпус , дальше нормализовал его pymorphy2, потом долго векторизация, но не понял зачем она и просто сделал ordereddict Это подразумевалось по частотным анализом? Ниже небольшой отрывок после беглой чистки от междометий и тп. https 534 работа 493 gpt3 480 работать 462 запрос 435 результат 420 знать 379 человек 361 команда 356 группа 337 задача 319 мехмат 294 опыт 293

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Я вот подумал. SSE выполняет операции максимум с 64-битной точностью. А FPU - всегда с 80-битной. Разве не должно быть FPU точнее тогда?
The Bird of Hermes
13
как быть с принтером? такой подход прокатит?
zamtmn
12
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Я не понимаю, это троллинг или что? Швабрика поддерживают, который буквально пишет на ассемблере взаимодействия с винапи. Я это ещё написал загрузчик и хоть что-то изучаю в о...
Shadow Akira
6
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Карта сайта