170 похожих чатов

Господа и дамы, ИИ эксперты, подскажите не знающему (кто чем

сможет в любом виде: подходы, названия, ссылки, метрики) как получить ранжирующую модель, если есть пара тысяч отдельных и растянутых во времени наборов-образцов отсортированных предложений некоторой целевой аудиторией (наборы-сессии разного размера, где-то по 100 и до 200-300-та предложений) и необходимо ранжировать наборы новых ранее не встречавшихся в обучающих данных предложений под усредненные предпочтения этой целевой аудитории, которые могут быть также зависимы от времени, немного противоречивы (условно как поисковые выдачи оптимизируют имея логи выданной поисковой выдачи и что пользователи кликнули первым, что вторым...). Лучше ли решать это как задачу регрессии или классификации (проставив текстам в обучающих выборках позиции или классы 1, 2...,n и пытаться их угадывать) или подобия (из обучающих наборов сделать embeddings, уложить их в redis/qdrant и сортировать новые тексты по средней по cosine похожести на тор-k текстов из БД ) или как что-то из области рекомендательных систем (кажется не мой случай, так как пользователи уже одинаковой целевой аудитории и для наборов новых предложений будет постоянное состояние холодного старта-доступа к логам в реальном времени нет, модель нужна статичная для периодического переобучения и тоже интересно как принято отслеживать этот момент, например если NDCG по новым логам между выдачей и кликам пользователей стал падать); метрику для скора тут лучше использовать NDCG или другую; нужно ли как-то в обучающие данные добавлять метки времени, чтобы модель могла различить устойчивые и сезонные тренды в предпочтениях; а может быть надо какой-то ранжирующий трансформер на основе Sentence-Transformers обучать (так как пара тысяч выборок-образцов не выглядит как большая, кажется что-то предобученное лучше будет работать, чем обученное с нуля) или LLM учить с каким-то промтом "оцени интересность предложения от 0 до 100" или какой-то алгоритм learning to rank применить или даже в сторону ML смотреть (ранжировать по уверенности Bayes classifier - пробовал, похоже, что это не работает), а не нейросетей?

2 ответов

22 просмотра

А зачем вам ранжирующая модель если задача в сущности определять релеватная фраза некоторой сессии или нет (если я правильно понял)? Звучит чисто как задача классификации, где нужен прежде всего хороший претрейн на ваш домен данных

Sergey Bratchikov
А зачем вам ранжирующая модель если задача в сущно...

имея хороший претрейн вы и в zero-shot классификацию сможете и косинусная близость иметь смысл будет

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
открыть папку в проводнике: 1 - ShellExecute 2 - ExecuteProcess 3 - OpenDocument что лучше выбрать?
Alexey Kulakov
12
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
10
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, стандартный ;вызов процедуры ;option casemap:no...
Егор Анелькин
1
Карта сайта