215 похожих чатов

Когда оптимизируешь гиперпараметры с кросс валидацией, надо обращать внимание только

на test (val) результат, или также на train)? Типо, есть ли разница какая большая разница между test и train? Есть ли разница, если train относительно низкая (или высокая) по сравнению с test? Или все, что имеет значение - хороший средний test (val)?

12 ответов

32 просмотра

Желательно одинакого

Mashiron- Автор вопроса
Григорий Lᵖ space
Желательно одинакого

А если автоматизировать подбор, то как можно было бы это в единую метрику объединить? test-|test-train|, или это слишком сильное пенальти? И это одинаково плохо, когда test>train, как и test<train, или только test<train плохо, а test>train нормально?

Никто так не делает

Mashiron- Автор вопроса
Григорий Lᵖ space
Никто так не делает

Тогда как правильно делать? Делают, насколько я видел, просто игнорируя разницу, и смотря только на средний тест (полностью игнорируя train)

Mashiron- Автор вопроса
Григорий Lᵖ space
У тревора написно

Тревор это..? 😅 Ссылочку можно?

Mashiron
Тогда как правильно делать? Делают, насколько я ви...

Можно посмотреть по всем разделениям, если в каком-то блоке слишком большая разница от среднего значения по всем блокам - надо посмотреть, что с данными Если на трейне слишком высокая по сравнению с валидационной выборкой - модель переобучена, если валидационная выборка показывает сильно лучшие результаты по сравнению с тренировочной - у вас с большой вероятностью произошло пересечение выборок

Mashiron- Автор вопроса
Dmitry Abramov
Можно посмотреть по всем разделениям, если в каком...

Это всё хорошо, но не отвечает на вопрос, можно ли объединить все в одну объективную метрику, ибо что считается "слишком большая разница" очень размытое понятие, и что в итоге с этим делать - тоже непонятно. Имхо лучше немного переобученная модель которая лучше работает на тесте, чем не переобученная модель которая хуже работает на тесте, но мнения разнятся и никакой полезной теории по теме я не нашел. А также.. что значит "пересечение выборок"?

Mashiron
Это всё хорошо, но не отвечает на вопрос, можно ли...

Под пересечением выборок подразумевалось, что в базовом случае результат лучший, чем на трейне можно получить в случае, если данные пересекаются(в трейне и тесте одни и те же образцы)

Mashiron- Автор вопроса
Григорий Lᵖ space
читайте тревора

основы статистического обучения?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта