ядро свертки же?
Когда пробовал кейс по восстановлению кадров из видеопотока, я использовал ядро свертки пропорциональное размерам кадра, в тестах пробовал и (16,9), и (4,3), и (5,5) , но субъективно было приятней работать с первыми двумя =)
2) Скорость обучения тоже подбирается индивидуально, я обычно адаптивную ставлю от 0.2 и ниже, а если модель на финальной стадии то 0.02 и по уменьшению. Скорость может быть в пределах от 0 до 1, но 0 и больше 0.7 не вижу оснований использовать.
3) Дропауты, пока что, добавлял только к моделям с полносвязными слоями и в задачах классификации по другому пока руки не дошли попробовать
решил просто автоматизировать процесс подбора эмпирических параметров для ансамбля из мелких нейронных сетей заточенных под свой объект и сделать этот процесс хотя бы псевдо-эмпирическим. Думаю сейчас пойти в сторону генетических алгоритмов. Поэтому меня интересует скорее множество допустимых значений
Что посоветуете почитать по CNN, чтобы лучше понимать механику этого?
Обсуждают сегодня