алгоритмов всё равно приятно смотреть на быстрый и красивый перебор элементов массива.
Иногда интринсики позволяют использовать мощность процессора на 100%. Как это происходит?
В новых процессорах есть 128 или 256-битные регистры. При операциях туда временно кладется значение из ячейки памяти, например целое число. Уже может показаться что что-то не так, ведь тип int занимает всего 32 бита, зачем ему 128?
Почему бы не положить в регистр сразу 4 штуки int переменных? Ведь тогда мы получим ускорение как минимум в 4 раза, а если регистры 256-битные, но и во все 8. Это и позволяют делать интринсики.
Перебирая 50 000 000 элементов, я получил ускорение не в 4 или 8 раз, а в несколько десятков, ведь процессор не только обрабатывает сразу несколько значений, но и значительно реже обращается к памяти.
Основная сложность работы заключается в понимании процессора. К тому же сейчас не все процессоры поддерживают Интринсики, поэтому всегда проверяйте их наличие, и пишите простую реализацию.
Ещё когда я писал код, то мне не нравилось что не для всех переменных доступны методы. Частенько какой-то метод жаловался на то, что ему нужен float, когда у меня тип был double, хотя казалось бы тут не составляет труда пепепарсить это дело, но нет, пляшите с бубном.
В общем тема интересная, особенно для бекендщиков, которые должны писать код, потенциально рассчитанный на миллионы запросов в секунду. И, думаю, в будущем все библиотеки будут переписываться с учётом разрядности регистров, так что дело очень перспективное.
Очень пригодится, особенно при разработке на Forms. Других-то bottleneck'ов не осталось.
Обсуждают сегодня