215 похожих чатов

Кто может подсказать, почему я беру тренировочный датасет с соревов

на кэггл и после Startified 7-fold кросс-валидации классификатора на нем получаю средний ROC-AUC = 0.89.

Однако когда делаю простой train_test_split - тренируюсь на train, оцениваю на test - получаю ROC-AUC = 0.81.

Когда в submission на кэггл отправляю предсказания на тестовом кэггловском датасете - выдает скор = 0.8.

Почему так далеко от кросс-валидации?

Я бы еще мог предположить что разные выборки в тесте и трейне, но почему тогда обычный train_test_split выдал результат - самый правдоподобный по сравнению к кэгглу?

5 ответов

1 просмотр

Вы используете стратификацию?

⬜️-troglodytes Автор вопроса
Viktor
Вы используете стратификацию?

я юзаю StratifiedKFold: X, y = train.drop(['booking_status'], axis=1), train['booking_status'] xgb_classifier = xgb.XGBClassifier(n_jobs=-1, eval_metric='auc', n_estimators=50) stratified_cv = StratifiedKFold(n_splits=10, shuffle=True, random_state=42) roc_auc_scores = cross_val_score(xgb_classifier, X, y, cv=stratified_cv, scoring='roc_auc') mean_roc_auc = roc_auc_scores.mean() print(f"Mean ROC AUC Score: {mean_roc_auc:.4f}")

сэмплов много?

⬜️-troglodytes Автор вопроса
⬜️ troglodytes
7 Folds

кстати, у вас в коде написано 10: stratified_cv = StratifiedKFold(n_splits=10, shuffle=True, random_state=42)

Похожие вопросы

Обсуждают сегодня

я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Всем привет! Массив вводится с клавиатуры, кол-во элементов неизвестно, поэтому я указал arr db 100 dup(?) С нахождением максимума проблем нет, а вот минимум почему-то всегд...
En Vind Av Sorg
11
в сях есть множество как в питоне? для удаление дубликатов
Linus
25
читать файл максимально быстро? странный вопрос))
zamtmn
53
Я хочу запустить свой проект в тг. Что-то между пирамидой и майнилкой. Еще подобного ничего не было. Уникальная идея. Нужен именно не бот, а приложение. С ввод, выводом тон...
Павел А.
6
а как бы вылезти из ИО, что то типа IO -> Ether или в какую сторону смотреть ? что то туплю
Fedor
14
тоесть, указав return eax, сгенерируется никому ненужная инструкция mov eax,eax ?
Aiwan \ (•◡•) / _bot
24
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
Реально в одиночку написать игровой движок на Си?
ㅤ (SVO)
11
Всем привет, товарищи! Можете меня поздравить, получил "отлично" за дисциплину "языки программирования низкого уровня". Честно говоря, не очень хочу, чтобы основы асма, которы...
Ыиу
1
Карта сайта