и x86 dup или broadcast? Инструкции, которые копируют флотовые числа и вставляет во все флотовые ячейки вектора. Ищу и не нахожу ничего в документах
dup в асмах это вроде не инстукция а директива самого асма, которая может и отсутствовать. она создана для упрощения выделения/инициализации массива данных одинаковыми значениями
Добрый день. Если у некоторых архитектур есть несколько fpu сопроцессоров, то почему нельзя программировать отдельные fpu? В смысле я имею в виду, что ассемблер - это упрощенный язык? Там автоматически подключается 2 fpu в одной итерации?
у меня на компе 8 fpu сопроцессоров, но мне лень разбираться с многопоточностью
Я не про многопоточность. Я говорю, что в ядре бывают 2 fpu
Это не FPU а блоки исполнения микроопераций. Их нужно много (посмотрите также сколько блоков в ИНТ части) чтобы реализовалась суперскалярность, внеочередное исполнения и многие другие микроархитектурные плюшки. И да - помощью всего этого можно выполнять не одну а много инструкций за такт, на текущих процессорах до 4 на линейном коде и 6 на коде который уже есть в кеше микроорераций (не путать с кэшами 1,2, 3 уровней). Достижение таких поквзателей практически нереально для осмысленных алгоритмов но с помощью тщательной оптимизации можно приблизиться, если алгоритм позволяет. Большинство программ, которые никто особо не оптимизирует выполняются на 1-2 инструкций за такт и менее.
Обсуждают сегодня