215 похожих чатов

Когда оптимизируешь гиперпараметры с кросс валидацией, надо обращать внимание только

на test (val) результат, или также на train)? Типо, есть ли разница какая большая разница между test и train? Есть ли разница, если train относительно низкая (или высокая) по сравнению с test? Или все, что имеет значение - хороший средний test (val)?

12 ответов

16 просмотров

Желательно одинакого

Mashiron- Автор вопроса
Григорий Lᵖ space
Желательно одинакого

А если автоматизировать подбор, то как можно было бы это в единую метрику объединить? test-|test-train|, или это слишком сильное пенальти? И это одинаково плохо, когда test>train, как и test<train, или только test<train плохо, а test>train нормально?

Никто так не делает

Mashiron- Автор вопроса
Григорий Lᵖ space
Никто так не делает

Тогда как правильно делать? Делают, насколько я видел, просто игнорируя разницу, и смотря только на средний тест (полностью игнорируя train)

Mashiron- Автор вопроса
Григорий Lᵖ space
У тревора написно

Тревор это..? 😅 Ссылочку можно?

Mashiron
Тогда как правильно делать? Делают, насколько я ви...

Можно посмотреть по всем разделениям, если в каком-то блоке слишком большая разница от среднего значения по всем блокам - надо посмотреть, что с данными Если на трейне слишком высокая по сравнению с валидационной выборкой - модель переобучена, если валидационная выборка показывает сильно лучшие результаты по сравнению с тренировочной - у вас с большой вероятностью произошло пересечение выборок

Mashiron- Автор вопроса
Dmitry Abramov
Можно посмотреть по всем разделениям, если в каком...

Это всё хорошо, но не отвечает на вопрос, можно ли объединить все в одну объективную метрику, ибо что считается "слишком большая разница" очень размытое понятие, и что в итоге с этим делать - тоже непонятно. Имхо лучше немного переобученная модель которая лучше работает на тесте, чем не переобученная модель которая хуже работает на тесте, но мнения разнятся и никакой полезной теории по теме я не нашел. А также.. что значит "пересечение выборок"?

Mashiron
Это всё хорошо, но не отвечает на вопрос, можно ли...

Под пересечением выборок подразумевалось, что в базовом случае результат лучший, чем на трейне можно получить в случае, если данные пересекаются(в трейне и тесте одни и те же образцы)

Mashiron- Автор вопроса
Григорий Lᵖ space
читайте тревора

основы статистического обучения?

Похожие вопросы

Обсуждают сегодня

Anyone here suffers from unexplained aural migraines, who would be up for talking for a bit? Doesn't *have* to be aural, but I am not asking about headaches, I mean actual mi...
Martin Rys
55
Сonst magicTgHTML = (text, entities) => { let processedText = text; let offsetShift = 0; entities.forEach(entity => { const { offset, length, type, url, ...
Андрей
1
подскажите пожалуйста, как мне освободить результат записанный в переменную result? в чем проблема подскажите если МОЖЕТЕ?
Михаил Helper
28
есть тут кто-то , кто только начал изучать си? если проходите курс на степике или как-то сами изучаете, пишите, может, скооперируемся?..
Eule
25
Слушайте, ещё такая интересная задачка. Сделан аудит действий пользователей через триггеры в базе, соответственно каждый пользователь имеет свой логин и пароль в базе. Это пре...
Сергей Бычков
12
Кстати, раз про скачивание файлов разговор зашел) Сделал бота для себя (транскрибирующего и суммаризирующего встречи) но не ожидал что за 2 месяца 10к пользователей набежит😅...
Andrey Obolenskiy
8
вопрос по москвину - не понимаю вот такого вопроса похоже Сколько разных всегда завершающихся функций с типом a -> a -> b -> a -> a можно реализовать? Две функции одинаково...
Fedor
11
Скажите, тут нет проблемы? IMyInterface1 = interface function GetInterface2: IInterface2; ... function TMyInterface.GetInterface2: IInterface2; begin Result := TI...
Ruslan aka DUDE
18
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Утра доброго. Просветите пожалуйста. Хочу сделать rest сервер на делфи. Посмотрел 3 фреймворка: dmvc, Mars, mormot. Ни в одном из них не упоминается ассинхронная обработка вхо...
Сергей Бычков
10
Карта сайта