215 похожих чатов

Ребята, нужна помощь/совет (лонгрид, извините) Решаю задачу разработки рекомендательной системы на

основе трансформера на открытом датасете MovieLens, задачу сам себе поставил для обучения

Оговорюсь, ранее не обучал трансформеры и не работал с PyTorch

Для тех кто не знаком с датасетом, дам краткое описание: там три таблички, табличка с фильмами и жанрами, табличка с пользователями и информацией по ним (пол, возраст, род деятельности) и табличка с оценками фильмов пользователями (что пользователь смотрел, когда и какую оценку по пятибальной шкале поставил).

Данные я подготовил следующим образом: объединил таблицы и сгруппировал данные по пользователям, для каждого пользователя отсортировал историю просмотров с оценками в хронологическом порядке по timestamp, организовал цепочки фильмов и оценок со сдвигом для обучения (пример: пользователь посмотрел 20 фильмов, я нарезаю данные окном 10, 9 фильмов в цепочке, 10-й как target, итого 11 цепочек).

Теперь как я вижу трансформер

Input для модели: цепочки фильмов с жанрами и оценками, которые пользователь смотрел, данные пользователя, жанр и id фильма, который требуется оценить.
Output модели: оценка нового фильма.

Теперь где я застрял:
1. Как правильно подготовить эмбеддинги и подать данные на вход трансформеру? Я вижу для себя три разных непересекающихся домена данных: данные пользователей, данные фильмов и истории просмотров. Не уверен, что корректно схлопывать все в один тензор torch.cat(tensors), не смотря на то, что я организовал одинаковую размеренность векторов. Но как обучать эмбеддинги параллельно и независимо я не знаю.

2. Как правильно заэмбеддить истории просмотров фильмов с их жанрами и истории оценок? В отличие от данных пользователя это цепочки

3. Как правильно поработать с жанрами? Была идея обучить отдельную сетку на жанрах, чтобы получить эмбэддинги и не работать с бинарным вектором размерностью 17 (всего 18 уникальных жанров). Но возможно эти эмбецдинги также обучатся в трансформере параллельно с данными пользователя и цепочками

спасибо, если ты дочитал до этого момента, буду рад любой помощи или совету 🙏

1 ответов

22 просмотра

а можно спросить одно, а зачем тебе тут торч?

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
я так понимаю, я так подозреваю, что создание такого плагина для человека, кто умеет писать плагины для делфи потребует минут 5-10 времени. но это мое подозрение. хотелось бы ...
Kraszx
7
Всем привет! Кто пользуется DevExpress, подскажите пожалуйста, реализован ли в TcxGrid в новых версиях поиск по датам как в Экселе (ну т.е. не просто список чекбоксов со значе...
A Z
4
Карта сайта