и сделать кроссвалидацию по ним, но это грозит переобучением. Каким образом это можно сделать если у нас ответов нету. То есть, в первой фолд попадает кусок теста и как модель обучиться если незнает ответов?
Подожди. Есть All Data. Для всех объектов из All Data нам известны ответы. Обычный подход это разделить All Data на Train и Test. И там и там у нас тоже соответственно будут ответы. Кросс-валидацию по-умному надо проводить ТОЛЬКО на Train. Я спросил можно ли проводить на All Data. Знающие ребята сказали, что не стоит, так как это может привести к переобучению.
Обсуждают сегодня