Подскажите, а как добавление group_id при создании пула может влиять

на тренировку модели?
Тестирую 2 варианта, различие только в том что в одном варианте pool создаю без group_id а во втором с group_id.
Бинарная классификация, CatBoostClassifier
Val ROC_AUC в первом случае 0.87
во втором 0.89
Данных много, то есть это не случайность связанная с трейном на GPU.
model.get_all_params() - сходятся 1 в 1

group_id добалял чтоб отслеживать и ранкинговые метрики тоже

9 ответов

63 просмотра

привет! group id — это про ранжирование, на классификацию не влияет

Sergey-S Автор вопроса
Евгений Петров
привет! group id — это про ранжирование, на класси...

Да вот и я так думал) Но уезжают все метрики, и логлосс и аук.

Sergey S
Да вот и я так думал) Но уезжают все метрики, и ло...

по числу деревьев модели одинаковой длины? группы могут влиять, если поставить эвал метрику ранжирующего типа если нужно только наблюдать ранжирующие метрики, то нужно передавать их через custom_metrics ну, и обучить-сравнить 10 моделей с разными сидами и/или кросс-валидацию сделать

Sergey-S Автор вопроса
Евгений Петров
по числу деревьев модели одинаковой длины? группы ...

Модели одинаковые и по числу деревьев тоже. Тестирую вот так: "eval_metric": "AUC", "custom_metric": ["Logloss", "AUC", "PRAUC"] на 10 сидах AUC min, mean, max: (0.8879694938659668, 0.8883961975574494, 0.8886796534061432) (0.8473901450634003, 0.8725292295217514, 0.8821778893470764) Хуже, когда генеришь пул с group_id.

Sergey-S Автор вопроса
Евгений Петров
по числу деревьев модели одинаковой длины? группы ...

Модели одинаковые и по числу деревьев тоже. Тестирую вот так: "eval_metric": "AUC", "custom_metric": ["Logloss", "AUC", "PRAUC"] на 10 сидах AUC min, mean, max: (0.8879694938659668, 0.8883961975574494, 0.8886796534061432) (0.8473901450634003, 0.8725292295217514, 0.8821778893470764) Хуже, когда генеришь пул с group_id.

Sergey S
Модели одинаковые и по числу деревьев тоже. Тестир...

group_id как фича в пул без указаний group_id случайно не проливается?

выглядит неочевидно какое качество получается, если сделать group_id = range(0, sample_count)? типа, группы есть, но все одноэлементные? есть ли в датасете катфичи?

Sergey-S Автор вопроса
Евгений Петров
выглядит неочевидно какое качество получается, есл...

С одноэлементными группами качество такое-же как и без групп. Катфичи есть. По одной из них как раз строил группы.

Похожие вопросы

Обсуждают сегодня

Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Коллеги, приветствую! Появилась не совсем тривиальная задача реализовать в nginx редирект HTTPS —> HTTP. Да, именно так, а не наоборот. Мы разрабатываем embedded устройство,...
Никита
24
Карта сайта