не завезли?
это который discriminant analysis? а зачем, когда у тебя есть glm / lmer4?
Это который Latent Dirichlet Allocation.
а это чем не угодило? http://text2vec.org/ В частности, http://text2vec.org/topic_modeling.html Неясно, какая задача. Нельзя исключить, что нужно будет что-то другое.
а он хоть где-то есть иерархический?
https://github.com/nicolaroberts/hdp - нашёл вот такое, но надо смотреть, что внутри)
я бы от задачи шел. аббревиатуры алгоритмов — круто, но мало.
да, есть и статьи и реализации на C/python. например, здась: https://github.com/bab2min/tomotopy
В gensym тоже есть.
Я продолжаю наивно думать, будто бы я уже достаточно взрослый, чтобы задавать вопросы, зная, чего я хочу ими добиться.
В 2014-15 годах видел, как это работает на данных твиттОра в реальном времени и хотел попробовать в качестве бейзлайна. Так-то я прекрасно понимаю, что время всяких LDA/ARTM уже давно прошло.
Нет никаких сомнений. Дело в том, что мы не дотягиваем. И мысли читать не умеем.
Это не угодило тем, что надо самому кол-во топиков задавать. А это вещь неизвестная, особенно в реалтайме. Отсюда и hLDA.
Не надо читать мысли, достаточно прочитать текст вопроса. Я погуглил и увидел, что похожие запросы остались без ответа. Здесь спросил, чтобы финально в этом убедиться.
хорошо, ушел читать текст вопроса.
А вот что сейчас пришло на замену мне пока не понятно. На Hugging Face topic modelling отсутствует как класс.
думаю, оно в text classification
Поговаривают, что вот этим: https://github.com/MaartenGr/BERTopic
может в сторону contextualized topic modelling посмотреть?
Та же интуиция подсказывала, что нужно просто добавить к поисковому запросу BERT/GPT/Transformers =)
Скорее тогда уж summarization.
Обсуждают сегодня