172 похожих чатов

Наткнулся на оптимизацию "branchless". Решил воспроизвести. Теперь пытаюсь переварить результаты:

работает или нет? Может кто глянуть?

https://gist.github.com/n-bes/d6a3eb12c49c4c928452556df4bcff33
https://youtu.be/g-WPhYREFjk?t=3416

14 ответов

26 просмотров

На годболт выведи

n- Автор вопроса
Dmytro Polunin
На годболт выведи

Там с рандомом плохо

n- Автор вопроса
Пух
Эээ?

[dependencies] rand = "0.8.4"

n
[dependencies] rand = "0.8.4"

Суть в том чтобы посмотреть asm а для этого и одной функции хватит.

n- Автор вопроса
Dmytro Polunin
На годболт выведи

https://rust.godbolt.org/z/xeP483Mzh

Судя по всему, работает. Только ты неправильно godbolt используешь, туда имеет смысл класть на проверку минимальные куски кода, обозримые, и проверять на хотя бы втором уровне оптимизации (ключ -C opt-level=2). Я проверил на двух вариантах: pub fn sum(conditions: &[bool], values: &[u32]) -> u32 { let mut sum = Wrapping(0); for i in 0..3 { if conditions[i] { sum += Wrapping(values[i]); } } sum.0 } и pub fn sum(conditions: &[bool], values: &[u32]) -> u32 { let mut sum = Wrapping(0); for i in 0..3 { sum += Wrapping((conditions[i] as u32) * values[i]); } sum.0 } Судя по ассемблеру, во втором коде команд перехода существенно меньше, чем во втором.

11,001 ns/iter К слову операции которыя длятся пару тактов смысла бенчить мало - любая фоновая задача в операционке и результаты плывут

n- Автор вопроса

начало топика читал?

n- Автор вопроса
n
начало топика читал?

sorry, ты первый и ответил)

n
начало топика читал?

Да. И если бы ты действительно хотел избавиться от лишних бранчей, то написал как-то так: let values = &values[..500]; let conditions = &conditions[..500]; for i in 0..500 { ...

n- Автор вопроса

Я как-то ожидал, что компилятор по-умнее, и в рамках маленькой функции сможет собрать наиболее оптимизированный код

n
Я как-то ожидал, что компилятор по-умнее, и в рамк...

Не-а. Сообщение о выходе за границы включает в себя ошибочный индекс, поэтому снизить количество проверок до одной компилятор не может, ибо это поменяет наблюдаемое поведение. А вот если сразу заранее отрезать слайс нужного размера, то компилятор уже может доказать, что индекс всегда находится в нужных пределах, выкинуть проверки и векторизовать код

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
1
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Ребят в СИ можно реализовать ООП?
Николай
33
Карта сайта