Добрый день, хотел бы уточнить один момент по кодированию кат

фичей у катбуста.

Я правильно понимаю, что мы считаем статистики по таргету для наблюдений после каждой пермутации, после чего они усредняются для получения итогового значения?

Из доки просто следует, что как будто бы мы просто много раз случайно перемешиваем датасет, а сами статистики считаем только один раз.

5 ответов

24 просмотра

Нет, случайно выбираются, без усреднения

K-S- Автор вопроса
See All
Нет, случайно выбираются, без усреднения

хм... То есть если мы сделали N пермутаций, у нас для каждого наблюдения есть N значений статистики по таргету, и в качестве итоговой мы берем просто случайную из этих N для каждого наблюдения?

K-S
хм... То есть если мы сделали N пермутаций, у нас ...

Нет, мы берём одну пермутацию для одного дерева и по ней считаем сплиты. Финальные значения в листьях, при этом, берутся с использованием отдельной (четвертой) пермутации, чтобы ещё дальше отодвинуть оверфит

K-S- Автор вопроса
See All
Нет, мы берём одну пермутацию для одного дерева и ...

А, точно. Что-то пункт про сплиты в доке я проглядел

Похожие вопросы

Обсуждают сегодня

1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Карта сайта