https://catboost.ai/docs/concepts/quantization.html#quantization. Может ли кто-нибудь подсказать, откуда появятся повторяющиеся объекты в weight при использовании MinEntropy? Например, если у нас трейнинг сет, где часть объектов имеют одинаковую качественную переменную, все же объекты уникальны и тогда почему в одной "корзине" объекты будут повторятся? Или здесь речь идет об объектах, у которых одинаковый label value?
На самом деле тут имеется ввиду N-количество уникальных значений признака, Weight-сколько раз это значение встретилось по всем объектам. Согласен, что по документации это совершенно непонятно.
Обсуждают сегодня