172 похожих чатов

Наткнулся на оптимизацию "branchless". Решил воспроизвести. Теперь пытаюсь переварить результаты:

работает или нет? Может кто глянуть?

https://gist.github.com/n-bes/d6a3eb12c49c4c928452556df4bcff33
https://youtu.be/g-WPhYREFjk?t=3416

14 ответов

30 просмотров

На годболт выведи

n- Автор вопроса
Dmytro Polunin
На годболт выведи

Там с рандомом плохо

n- Автор вопроса
Пух
Эээ?

[dependencies] rand = "0.8.4"

n
[dependencies] rand = "0.8.4"

Суть в том чтобы посмотреть asm а для этого и одной функции хватит.

n- Автор вопроса
Dmytro Polunin
На годболт выведи

https://rust.godbolt.org/z/xeP483Mzh

Судя по всему, работает. Только ты неправильно godbolt используешь, туда имеет смысл класть на проверку минимальные куски кода, обозримые, и проверять на хотя бы втором уровне оптимизации (ключ -C opt-level=2). Я проверил на двух вариантах: pub fn sum(conditions: &[bool], values: &[u32]) -> u32 { let mut sum = Wrapping(0); for i in 0..3 { if conditions[i] { sum += Wrapping(values[i]); } } sum.0 } и pub fn sum(conditions: &[bool], values: &[u32]) -> u32 { let mut sum = Wrapping(0); for i in 0..3 { sum += Wrapping((conditions[i] as u32) * values[i]); } sum.0 } Судя по ассемблеру, во втором коде команд перехода существенно меньше, чем во втором.

11,001 ns/iter К слову операции которыя длятся пару тактов смысла бенчить мало - любая фоновая задача в операционке и результаты плывут

n- Автор вопроса

начало топика читал?

n- Автор вопроса
n
начало топика читал?

sorry, ты первый и ответил)

n
начало топика читал?

Да. И если бы ты действительно хотел избавиться от лишних бранчей, то написал как-то так: let values = &values[..500]; let conditions = &conditions[..500]; for i in 0..500 { ...

n- Автор вопроса

Я как-то ожидал, что компилятор по-умнее, и в рамках маленькой функции сможет собрать наиболее оптимизированный код

n
Я как-то ожидал, что компилятор по-умнее, и в рамк...

Не-а. Сообщение о выходе за границы включает в себя ошибочный индекс, поэтому снизить количество проверок до одной компилятор не может, ибо это поменяет наблюдаемое поведение. А вот если сразу заранее отрезать слайс нужного размера, то компилятор уже может доказать, что индекс всегда находится в нужных пределах, выкинуть проверки и векторизовать код

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Карта сайта