1
... __builtin_ia32_vfmaddps(...) {
...
#if __iset__ <= 4
__di tmp0 = __builtin_e2k_pfadds (__builtin_e2k_pfmuls (s1.l.l0, s2.l.l0), s3.l.l0); // Зачем!?
....
#elif __iset__ <= 5
dst.__v2di = __builtin_e2k_qpfadds (__builtin_e2k_qpfmuls (s1.__v2di, s2.__v2di), s3.__v2di); // Зачем!?
...
}
Не пойму, там что FMA заменили на последовательное умножение и сложение?
Именно!
Это …..здец
Обсуждают сегодня