Привет! Я пытаюсь разобраться в SIMD, написал небольшой код провел

Question

Привет! Я пытаюсь разобраться в SIMD, написал небольшой код провел

тесты на коленке и у меня возник вопрос: почему векторизованное сложение элементов массива (через vector<T>) работает в 2 раза медленнее чем скалярное сложение в цикле? Что я делаю не так? Процессор поддерживает Intel® SSE4.2, компилиться под RyuJit в x64. КУда копать?

#backend #dot #programming #russian

0

21.01.2019