сможет в любом виде: подходы, названия, ссылки, метрики) как получить ранжирующую модель, если есть пара тысяч отдельных и растянутых во времени наборов-образцов отсортированных предложений некоторой целевой аудиторией (наборы-сессии разного размера, где-то по 100 и до 200-300-та предложений) и необходимо ранжировать наборы новых ранее не встречавшихся в обучающих данных предложений под усредненные предпочтения этой целевой аудитории, которые могут быть также зависимы от времени, немного противоречивы (условно как поисковые выдачи оптимизируют имея логи выданной поисковой выдачи и что пользователи кликнули первым, что вторым...). Лучше ли решать это как задачу регрессии или классификации (проставив текстам в обучающих выборках позиции или классы 1, 2...,n и пытаться их угадывать) или подобия (из обучающих наборов сделать embeddings, уложить их в redis/qdrant и сортировать новые тексты по средней по cosine похожести на тор-k текстов из БД ) или как что-то из области рекомендательных систем (кажется не мой случай, так как пользователи уже одинаковой целевой аудитории и для наборов новых предложений будет постоянное состояние холодного старта-доступа к логам в реальном времени нет, модель нужна статичная для периодического переобучения и тоже интересно как принято отслеживать этот момент, например если NDCG по новым логам между выдачей и кликам пользователей стал падать); метрику для скора тут лучше использовать NDCG или другую; нужно ли как-то в обучающие данные добавлять метки времени, чтобы модель могла различить устойчивые и сезонные тренды в предпочтениях; а может быть надо какой-то ранжирующий трансформер на основе Sentence-Transformers обучать (так как пара тысяч выборок-образцов не выглядит как большая, кажется что-то предобученное лучше будет работать, чем обученное с нуля) или LLM учить с каким-то промтом "оцени интересность предложения от 0 до 100" или какой-то алгоритм learning to rank применить или даже в сторону ML смотреть (ранжировать по уверенности Bayes classifier - пробовал, похоже, что это не работает), а не нейросетей?
А зачем вам ранжирующая модель если задача в сущности определять релеватная фраза некоторой сессии или нет (если я правильно понял)? Звучит чисто как задача классификации, где нужен прежде всего хороший претрейн на ваш домен данных
имея хороший претрейн вы и в zero-shot классификацию сможете и косинусная близость иметь смысл будет
Обсуждают сегодня