обучить ранжировщик с 'LambdaMart' в качестве лосса.
2) Датасет не поделён на группы/запросы. Поэтому в group_id трейнового Pool передаю список с константным значением, типа есть одна группа.
3) При запуске catboost.cv с этим лоссом в параметрах и кастомным сплиттером на фолды ловлю
CatBoostError: Objects with the same group I'd must be in the same fold
Это можно как-то обойти?
кажется, что в такой постановке результат кросс-валидации будет непоказательным. чтобы был осмысленный результат, групп в датасете должно быть много. ну, и ранжирование с одной большой группой обычно бывает не очень точным. возможно, Кирилл/Стас @vlasovk @kizill лучше подскажут, как можно более правильно подойти.
Обсуждают сегодня