Менял сабсемпл - получил такие вот странные значения ошибки (меньше

- лучше)

это больше похоже на статистическую погрешность ? или так может быть что оптимум в 0.2 и в 1 ? и зависимость не-монотонна ?

не встречал ли кто такое ?

5 ответов

54 просмотра

Размеры датасета укажи Выглядит так что тест/валидация просто маленькие Ну или у тебя в целом очень низкая связь с референсом (только около 0.2 имеют прямую связь)

Alexander-C Автор вопроса
Cvt
Размеры датасета укажи Выглядит так что тест/вали...

Точно датасет очень мало всего 600+ семплов , как ты понял что мал ?

Ну вот, у тебя где-то порядка от 60 до 120 реально полезных семплов, остальное каша Такие рандомные разбросы вообще не удивительны на маленьких датасетах, особенно если random_state не фиксируешь

Alexander-C Автор вопроса
Cvt
Ну вот, у тебя где-то порядка от 60 до 120 реально...

Так а какое ожидание поведение скора в зависимости от subsample , colsample ? (Если данных много) Типа куска параболы ? Или как ?

Alexander C
Так а какое ожидание поведение скора в зависимости...

colsample вообще в целом не должен аффектить точность В первую очередь это шутка необходимая для ускорения обучения модели и может повлиять негативно\позитивно только если у тебя есть оверфит или андерфит, что намного лучше другими параметрами регулируется (в целом с уменьшением colsample нужно больше итераций, но они быстрее считаются, если количество фичей очень большое, до 20 фичей скорее всего не увидишь разницы) Советую почитать доку по этому поводу subsample опять же, может помочь в случае оверфита (особенно при большой глубине, по крайней мере как следует из доки) Но в целом, он опять же ускоряет обучение модели в 1/subsample раз

Похожие вопросы

Обсуждают сегодня

1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Карта сайта