сеть, нежели без cuda.
Если проводить циклы обучения по одной выборке в минибатче, каждый раз расчитывая loss - loss уменьшается быстрее с каждым циклом.
Если провести один цикл со всеми выборками в одном минибатче - то loss слабо уменьшится, но зато произойдёт практически мгновенно.
Получается, что циклы - проходят на CPU и это замедляет вычисления на GPU, я правильно понимаю???
Обсуждают сегодня