Привет! Подскажите, почему разница между первым перемножением двух матриц размером 1024х1024

Question

Rust Beginners

𝕬𝖑𝖊𝖎𝖘𝖙𝖊𝖗 𝕱.

Привет! Подскажите, почему разница между первым перемножением двух матриц размером 1024х1024

и последующими ≈ в 15тыс. раз? Что там происходит на GPU в начальный момент..

#game #russian #rust

0

17.08.2023

8 ответов

28 просмотров

$К|/|pи/\/\-6е3yглbIи$ К|/|pи/\/\ 6е3yглbIи

ну тут скорее всего первичная инициализация буферов (???) и подобное я не мастак, но думаю из-за этого первая итерация медленная

0

17.08.2023

Денис Котляров

а не кажется ли, что использовать Instant + elapsed для бенчей плохая идея?. есть же cargo bench + скрипты бенча

0

17.08.2023

Денис Котляров

и далее, вы уверены, что ваши матрицы сразу оказались на gpu?. на каком моменте? на new/rand или в момент их первого использования это так, чисто на фигня/подумать вопрос (апи не знаю:) ) === немного оффтопа, но начал вопрос не я. про приложение сказать ничего не могу. и даже не обязательно эпл, но на армах действительно есть нейронные ОТДЕЛЬНЫЕ модули проца. и в самых обычных телефонах они моментом встречаются. сам я их никогда не использовал 😅

0

17.08.2023

𝕬𝖑𝖊𝖎𝖘𝖙𝖊𝖗 𝕱. Автор вопроса

Денис Котляров
и далее, вы уверены, что ваши матрицы сразу оказ...

Не сразу, но учитывая скорости передачи данных на GPU это должно быть несколько мс, никак не 480. И почему тогда нет разницы между перемещением двух матриц 512х512 (т.е. всего 2МБ) и 512 таких же матриц – все это занимает одинаковое время. Более вероятно, что CUDA что-то компилирует, разворачивает граф вычислений или типа того

0

17.08.2023

Денис Котляров

𝕬𝖑𝖊𝖎𝖘𝖙𝖊𝖗 𝕱.
Не сразу, но учитывая скорости передачи данных на ...

да, забыл, компиляция же еще.. но в любом случае, при сравнении с cpu эти аппарат телодвижения тоже надо учитывать.

0

17.08.2023

Temirlan Обязательно

Загрузка матриц из хоста на карту занимает долгое время.

0

18.08.2023

𝕬𝖑𝖊𝖎𝖘𝖙𝖊𝖗 𝕱. Автор вопроса