Всем привет! Кто-то читал статью, как получить 1 на наборе Титаника?: https://www.kaggle.com/code/yasirakyzl/titanic-ml-project-100-accuracy-with-svc То

Question

Всем привет! Кто-то читал статью, как получить 1 на наборе Титаника?: https://www.kaggle.com/code/yasirakyzl/titanic-ml-project-100-accuracy-with-svc То

ли автор что-то попутал, то ли я чего-то не понял, но вроде он использует в качестве проверки своей модели gender_submission.csv, который предназначен, как образец, того, что должно получиться, а не истиные значения.
Я просто хочу понять в чем его модель или данные для нее отличаются от моей, но выходит, что он просто использует не те данные для проверки

#database #programming #russian #software

0

24.10.2023

5 ответов

44 просмотра

Mashiron

Больше 0.8 без leakage или рандомного везения - практически нереально получить, т.к. тест на деле не сильно даже похож на данные, которые дают для тренировки. С leakage можно вплоть до 0.85 дойти, выше не видел (без читерства)

0

24.10.2023

NIX Автор вопроса

Mashiron
Больше 0.8 без leakage или рандомного везения - пр...

Ну вот в книге у автора получилось вот так

0

24.10.2023

Mashiron

NIX
Ну вот в книге у автора получилось вот так

Вероятно автор использовал все данные для preprocessing, а только потом делил на трейн/тест, т.е. допускал leakage. Но это чисто догадка. Так очень часто делают на каггле, т.к. зачастую получаются лучше результаты. Но в продакшн так не прокатит

0

24.10.2023

NIX Автор вопроса

Mashiron
Вероятно автор использовал все данные для preproce...

Ну, да, это баловство какое-то

0

24.10.2023

Евгений Петров · Accepted Answer

Евгений Петров

Единственный способ получить acc=1 на Титанике -- считерить, используя данные из внешних источников. Списки выживших есть в сети.

0

24.10.2023

215 похожих чатов

Всем привет! Кто-то читал статью, как получить 1 на наборе Титаника?: https://www.kaggle.com/code/yasirakyzl/titanic-ml-project-100-accuracy-with-svc То

5 ответов

Похожие вопросы