тренировочных/тестовых данных и затем их вызывать в момент тренировки модели.
Пытаюсь делать следующее:
1. Задаю pool и сохраняю его функцией save_quantization_borders:
dataset = Pool(
data=data[features["num_features"] + features["cat_features"]],
label=data[features["target"]],
group_id=queries,
cat_features=features["cat_features"]
)
dataset.quantize()
dataset.save_quantization_borders("train_dataset")
2. Потом вызываю датасет через Pool:
Pool("train_dataset")
3. При попытке обучения CatBoostRanker() с лоссом YetiRank он не видит заданные ранее группы:
Groupwise loss/metrics require nontrivial groups
Что в таком случае делать, как правильно сохранить pool и затем инициализировать его в момент обучения модели?
пробовал через save? https://catboost.ai/en/docs/concepts/python-reference_pool_save
Да, но потом я не могу из этого же файла pool загрузить обратно :( Если подскажешь как это делать, буду благодарна.
pool = Pool(…) pool.save(“my_pool.bin”) pool = Pool(“pool.bin”)
Попробуй pool = Pool(“quantized://pool.bin”)
Вроде сработало, спасибо!
Обсуждают сегодня