все равно проигрываю первому ответу со стэковерфлу. Почему, если дизасм функции char2int в моих двух вариантах (B и C) визуально меньше?
https://quick-bench.com/q/cG5siKSyn3Tozte1ttTZOPTYaJw
"Визуально меньше" — это очень плохая характеристика для описания быстродействия. :)
BENCHMARK_CAPTURE(Test, C, &B);
Обычно меньше кода => быстрее
ну в случае асм не так всё однозначно, иногда действительно можно так сказать :)
Исправил, спасибо. C стал на 5% быстрее A. Однако, это не объясняет того, почему B медленнее A.
Разворачивание циклов - первый из череды контрпримеров
Может наоборот?
https://godbolt.org/z/GKroo3xGf Я здесь ни вижу ни одного цикла.
Моя претензия к "обычно", а не к конкретному примеру
А что там сложного, ввёл два char, вычел '0' , подставил вес по массиву, один разряд сдвинул на 4 бита, соединил
Обычно быстрее это когда сумма времени каждой операции набора меньше суммы времени каждой операции другого набора
Ничего сложного. Но вариант C оказался самым быстрым. Без вычитаний '0' и прочих лишних операций.
Хмм. А если сделать один массив, который бы адресовывался одним uint16_t и сразу маппил все варианты char? Тогда удастся сэкономить на операциях битового сдвига и битового или. Но будут ли эти 65кб влезать в кэш....
Двумерный массив, где два измерения - деяния символов байта, а значение - бинарное значение байта
Ну вот да, я это и предложил только что
Только int 16 не надо, надо два символа и со смещением обратно к базе, коду ‘0'
Впрочем, 65кб - не обязательно. Нужно лишь несколько килобайт из центра этого массива. Т.е. адрес смещения вычисляем относительно начала значимых элементов массива. Вот только как это выразить на С не знаю.
Но ещё надо ошибки проверять, это много сожрëт
Каких килобайт, когда 256 байт
В моей задаче я точно уверен, что строка валидная и обращений за границей не будет. Ну, или можно надеяться на то, что произойдет segfault.
Не, ну так не честно
Есть вариант представления числа в hex записи не только 789ABCDEF, но и 789abcdef.
Это значения с 48 до 102.
Не 16x16, а 54x54=2916 байт.
Можно и в один регистр привести, это одно вычитание, или даже поставить битик...
И даже не 16х16, а 22х22, ведь в ASCII есть пропуски. Поэтому же (0x0F != 'F' - '0')
Обсуждают сегодня