мне кажется, разобрался в обратном распространении по слоям, и решил проверить, отключив обновление весов полносвязных слоёв. Ошибка уменьшается, но очень медленно, примерно на одну десятитысячную за сто итераций. Значит ли это, что я накосячил, или это нормальное поведение для весов в сверточных слоях?
Попробуй оставить только один полносвязный слой, заморозив его Так может быстрее обучаться
Обсуждают сегодня