215 похожих чатов

Когда оптимизируешь гиперпараметры с кросс валидацией, надо обращать внимание только

на test (val) результат, или также на train)? Типо, есть ли разница какая большая разница между test и train? Есть ли разница, если train относительно низкая (или высокая) по сравнению с test? Или все, что имеет значение - хороший средний test (val)?

12 ответов

27 просмотров

Желательно одинакого

Mashiron- Автор вопроса
Григорий Lᵖ space
Желательно одинакого

А если автоматизировать подбор, то как можно было бы это в единую метрику объединить? test-|test-train|, или это слишком сильное пенальти? И это одинаково плохо, когда test>train, как и test<train, или только test<train плохо, а test>train нормально?

Никто так не делает

Mashiron- Автор вопроса
Григорий Lᵖ space
Никто так не делает

Тогда как правильно делать? Делают, насколько я видел, просто игнорируя разницу, и смотря только на средний тест (полностью игнорируя train)

Mashiron- Автор вопроса
Григорий Lᵖ space
У тревора написно

Тревор это..? 😅 Ссылочку можно?

Mashiron
Тогда как правильно делать? Делают, насколько я ви...

Можно посмотреть по всем разделениям, если в каком-то блоке слишком большая разница от среднего значения по всем блокам - надо посмотреть, что с данными Если на трейне слишком высокая по сравнению с валидационной выборкой - модель переобучена, если валидационная выборка показывает сильно лучшие результаты по сравнению с тренировочной - у вас с большой вероятностью произошло пересечение выборок

Mashiron- Автор вопроса
Dmitry Abramov
Можно посмотреть по всем разделениям, если в каком...

Это всё хорошо, но не отвечает на вопрос, можно ли объединить все в одну объективную метрику, ибо что считается "слишком большая разница" очень размытое понятие, и что в итоге с этим делать - тоже непонятно. Имхо лучше немного переобученная модель которая лучше работает на тесте, чем не переобученная модель которая хуже работает на тесте, но мнения разнятся и никакой полезной теории по теме я не нашел. А также.. что значит "пересечение выборок"?

Mashiron
Это всё хорошо, но не отвечает на вопрос, можно ли...

Под пересечением выборок подразумевалось, что в базовом случае результат лучший, чем на трейне можно получить в случае, если данные пересекаются(в трейне и тесте одни и те же образцы)

Mashiron- Автор вопроса
Григорий Lᵖ space
читайте тревора

основы статистического обучения?

Похожие вопросы

Обсуждают сегодня

Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Ну вот просто даже давайте вот как. Какой нибудь конкретный кейс, можете в пример привести, где бч работает и приносит прикладную пользу, а не просто что бы было? Не крипту.
Alexander Andreev
22
объясните пожалуйста, почему функция не работает должным образом? вроде должно брать активное окно сравнивать его размер с размером экрана, и если есть совпадение = true прове...
JF
12
Гляньте, че бывает: Сегодня по одному проекту одной вебстудии делал проект небольшой, на их хостинге. На Modx revo. В определенный момент , работая в админке, вдруг перестал р...
Artem
7
лучше скажите, причём тут паскаль?
Alexey Kulakov
36
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
12
> Копаем глубже > Следующий момент был, когда я спросил его, знает ли он JavaScript. Он ответил, что его учили работать с C#. Я тоже в университете писал на C#, но даже там мн...
Oleg Volkov
4
И никого не интересует какие пакеты кто использует. ((% Заходишь на сайт симфони и видишь поддержку Украины - по законам РФ это ж экстремизм. Только никто не отказывается от с...
Am Ambrion
11
Кто нибудь либу Zstandart использовал ? Это либа для сжатия от Цукерберга
Andrey Electron
9
Чтобы перехватить все нажимания буков на форме, надо хук ставить? Пробовал на форме ОнКейДаун, оно ловит клаву если фокус не на компоненте с вводом текста
Serjone
15
Карта сайта