Похожие чаты

Слышал такую тему, что модели со значениями некоторых гиперпараметров, равными

степеням двойки обучаются на GPU быстрее. Есть че почитать/бенчмарки на эту тему?

3 ответов

18 просмотров

Такого нет, основные проблемы со скоростью доступа к памяти, а не в размерах элементов

Андрю Нг говорил про бэтч сайз. У него было какое-то обяснение связанное с тем (если я правильно помню), что на архитектурном уровне проще с двойками и их степенями работать.

Эмперически поковыряться)

Похожие вопросы

Обсуждают сегодня

Карта сайта