что кросс-валидация проводится только на трейн выборке, а на тестовой уже проверяется. Но почему нельзя делать кросс-валидацию на всей выборке (All Data)? Так мы имеем больше примеров для обучения и всё так же обучаемся на 4-х частях(80%) и каждый раз проверяемся на 5-й части(20%). Почему кросс-валидация тоже ограничивается трейн сетом, как и обычный процесс обучения и тестирования?
Можно и так. Но лучше иметь тест
лучше иметь тестовую выборку, с которой модель никогда не сталкивалась. Чьтобы быть уверенным, что не произошло переобучение
Риск переобучения
Обсуждают сегодня