тут наиболее сильная экспертиза по этому вопросу. Дело происходит на x86_64, доступны векторные расширения (непонятно пока какие). У меня есть буфер из float32, и где-то отдельно есть маска. Мне нужно в исходном буфере заменить нулями все такие элементы, маска для которых равна нулю. Вопрос: в каком формате представить такую маску, чтобы работало наиболее быстро? Очень много буферов надо замаскировать одинаково.
та если изначально загружены флоаты в вектор чеего их шаффлить-то
векторы не надо, надо маску распаковывать из бит в dword'ы... или не надо?
Обсуждают сегодня