batch size, модель начинает очень сильно оверфититься. Конкретно, если взять 64 то учится как положено, а при 128 validation accuracy болтается в районе долей процента.
Звучит как баг, но непонятно, в какую сторону копать.
Получилось найти причину? accuracy падает ступенчато после какого-то размера батча или постепенно?
Обсуждают сегодня