тесты на коленке и у меня возник вопрос: почему векторизованное сложение элементов массива (через vector<T>) работает в 2 раза медленнее чем скалярное сложение в цикле? Что я делаю не так? Процессор поддерживает Intel® SSE4.2, компилиться под RyuJit в x64. КУда копать?
мб где-то какие-то оптимизации срабатывают
ещё советуют проверить Vector.IsHardwareAccelerated
Обсуждают сегодня