Pool() из этого. Такое раньше разве было?
У меня просто старый код есть, где в натренированную модель я отдельный тест сет подаю просто как ndarray. Раньше все быстро предсказывалось, а сейчас все виснет на создании пула.
Catboost 1.2.1 в catboost/core.py:2484
https://github.com/catboost/catboost/blob/master/catboost/python-package/catboost/core.py#L2484
Виснет или работает медленнее чем хотелось?
Ну у меня большой датасет и пулы в целом всегда очень долго создаются и эта проблема всегда была. Но разве они должны создаваться когда predict() вызываешь?
То есть не виснет, но просто получается слишком долго и не могу предсказания используя отдельный ndarray получить за разумное время. Catboost при predict() всегда конвертировал в Pool() данные и раньше?
Должны. Все равно реализация работает через эту абстракцию так или иначе. Если есть существенное замедление применения при переходе от catboost 1.2 к 1.2.1 создайте issue на GitHub, конечно никакое замедление не планировалось.
Хорошо, понял. Я попробую сравнить версии, если есть замедление. До этого версию 1.1.1 использовал вроде бы.
У меня как раз проблемы возникают из-за того что тест сет с миллионами рядов и получается очень долго.
Обсуждают сегодня