в 2 раза дольше, нет?
Нет, конечно. Параметр learning_rate вообще ключевой в настройке. Грубо говоря, ты считаешь вектор сдвига в пространстве параметров, а потом домножаешь на learning_rate.
Обсуждают сегодня