Как быстрее, достать одну половину, сделать векторный pxor между xmm, а потом достать два скаляра и сделать между ними xor; или сразу доставать 4 скаляра и делать xor?
Тесть. Скорее всего, по половинам, операций тупо меньше.
Обсуждают сегодня