215 похожих чатов

Добрый день! Подскажите, с проблемой. Есть данные - клики и чтения пользователями

тематических статей в журнале. Есть тексты статьи разложены LDA -моделью на 20 топиков. Аналогично профиль интересов пользователя имеет размерность 20 и формируется исходя из истории кликов по какому-то закону (пусть, например, плавающее среднее)

Хочу обучить классификатор, который будет предсказывать вероятности принадлежности пары (профиль пользователя - профиль статьи) к классу 1 (клик/чтение статьи). Но вот беда - данные о кликах - это, естественно, данные класса 1, ведь нет кликов (0 класс) нет записи.

Я попробовал сделать pd.DataFrame().shift(n), то есть сместить на n, профили статей относительно профилей пользователей, как бы получая синтетические "неклики / нечтения" и общий набор данных с балансом классов 1:1, но на таких данных модель совершенно не учится (предсказывает константу).

В какую сторону искать решение проблемы? Почему модель не учится?

4 ответов

22 просмотра

как вариант можно сделать мультикласс, то есть у вас будет вектор 19 нулей и 1 единица, этот человек клинкнул на одну тему и не кликнул на 19 остальных

S S A-Sokol Автор вопроса
Elena
как вариант можно сделать мультикласс, то есть у в...

Нет-нет, 20 тем - это 20 колонок каждой статьи. Читая статью, пользователь кликает на 20-мерный вектор, где каждая координата - отношение статьи к той или иной из 20 тем. Значения этих координат определяет обученная LDA-модель

S S A-Sokol Автор вопроса

Спасибо! О таком еще не слышал

S S A-Sokol Автор вопроса

Благодарю!

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта