Привет, читаю документацию по кодировщику категориальных признаков. Правильно понимаю, что

в случае многоклассовой классификации с M классами энкодер вместо каждой категориальной фичи будет создавать M (M-1?) новых фичей?

Также вижу, что в случае регрессии таргет по медиане разбивается всего на два класса, если TargetBorderCount оставлять дефолтным. Насколько важно (по качеству) этот параметр тюнить?

2 ответов

15 просмотров

Правильно понимаю, что в случае многоклассовой классификации с M классами энкодер вместо каждой категориальной фичи будет создавать M (M-1?) новых фичей? CTR для каждого уникального класса, + Еще зависит от one_hot_max_size и еще кол-ва комбинаций (max_ctr_complexity) Также вижу, что в случае регрессии таргет по медиане разбивается всего на два класса, если TargetBorderCount оставлять дефолтным. Насколько важно (по качеству) этот параметр тюнить? Зависит от распредления таргета

Похожие вопросы

Обсуждают сегодня

1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Карта сайта