датасете
>как избежать проблему оверфита
Никак, да и не нужно
>BatchNorm как работает, почему он нужен всегда
Он нужен не всегда, см., например, https://arxiv.org/abs/2102.06171
Надеюсь, такие ответы засчитывались как правильные?
а второй пункт, почему? Вообще такая теория строится вокруг валидации. читал главу недавно у тревора, и каждый раз узнаешь что то новое.
Оверфит - ситуация, когда качество на трейне выше качества на валидации. Очевидно, что лучше оверфит с RMSE 0.1 на трейне и 0.2 на валидации, чем не оверфит с RMSE 10 на трейне 9 на валидации.
Мы сейчас про Early Stop говорим?
Нет, про оверфит
Обсуждают сегодня