фичей у катбуста.
Я правильно понимаю, что мы считаем статистики по таргету для наблюдений после каждой пермутации, после чего они усредняются для получения итогового значения?
Из доки просто следует, что как будто бы мы просто много раз случайно перемешиваем датасет, а сами статистики считаем только один раз.
Нет, случайно выбираются, без усреднения
хм... То есть если мы сделали N пермутаций, у нас для каждого наблюдения есть N значений статистики по таргету, и в качестве итоговой мы берем просто случайную из этих N для каждого наблюдения?
Нет, мы берём одну пермутацию для одного дерева и по ней считаем сплиты. Финальные значения в листьях, при этом, берутся с использованием отдельной (четвертой) пермутации, чтобы ещё дальше отодвинуть оверфит
https://youtu.be/wnTlsXaVj-s?t=5602
А, точно. Что-то пункт про сплиты в доке я проглядел
Обсуждают сегодня