215 похожих чатов

Такой вот вопрос, господа. Когда мы делаем hyperparameter tuning, указывая в

методе поиска оптимальных параметров random state (будь то grid search, random или bayesian) , мы для всех комбинаций параметров используем одинаковое разделение данных (если говорим о train_test_split, то два одинаковых сета, если про cv сплит, то одинаковые n сетов). Теоретически это означает, что best hyperparameters будет зависеть от random state, потому что они могут быть оптимизированы именно для заданного разделения.
С другой стороны, мы можем не указывать random_state и тогда все разделения будут рандомные, но мы потеряем в этом случае reproducability.
Указывание random_state не будет большой проблемой для больших датасетов, но для маленького количества данных и, тем более, если вариативность большая, то random_state может представлять опасность, верно?

2 ответов

5 просмотров
Dan-Berd Автор вопроса

Можно минимизировать эффект вариативности с помощью repeated k-fold cv, а еще можно каждое разделение делать по разному, но при этом сохранять reproducability. Кто-нибудь знает такие тулзы?

Это в optuna?

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
@ahndmn @ayaw0_0 здарова, на чем пишете?
Aiwan \ (•◡•) / _bot
7
Коллеги, как получить PId для собственного процесса из под линукса?
Роман Лях (rgreat)
6
Карта сайта