Ребята, правильно ли я все понимаю: есть весь датасет 100%.

Question

Ребята, правильно ли я все понимаю: есть весь датасет 100%.

Делим его на трейн часть и на отложенную тестовую выборку (пусть 70% на 30%). Далее мы на 70% проводим кросс-валидацию, при помощи которой сравниваем разные модели и выбираем лучшие гиперпараметры. Далее, уже определившись с моделью и ее гиперпараметрами, мы обучаем модель на всей трейн выборке (70% от всего датасета), а потом проверяем качество модели на отложенной выборке (30%). Я все правильно понимаю? Это же общепринятый и стандартный подход к обучению?

#database #programming #russian #software

0

09.08.2019