215 похожих чатов

Добрый день. Что можно делать с сообщениями из чатов? Я

имею в виду помимо частотного анализа , можно же сделать какой-то NLP и тп. Посоветуйте пожалуйста, не могу придумать.
Например делаю маркетинговый анализ для ниши тортов, нахожу тематические чаты, получаю 1м+ сообщений и что?

2 ответов

18 просмотров

я бы начал всё таки с частотного и с формулировки задачи. А так вытащить можно много всего, например инты и всё что вокруг них с ограничениями в виде символов пунктуации, какие то определенные слова-маркеры интересующие вас и т.д.

std::divconq- Автор вопроса
Антон Дорохов
я бы начал всё таки с частотного и с формулировки ...

Привет, спарсил чат ВМК, прошёлся регуляркой /w+ и получил корпус , дальше нормализовал его pymorphy2, потом долго векторизация, но не понял зачем она и просто сделал ordereddict Это подразумевалось по частотным анализом? Ниже небольшой отрывок после беглой чистки от междометий и тп. https 534 работа 493 gpt3 480 работать 462 запрос 435 результат 420 знать 379 человек 361 команда 356 группа 337 задача 319 мехмат 294 опыт 293

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Карта сайта