172 похожих чатов

Наткнулся на оптимизацию "branchless". Решил воспроизвести. Теперь пытаюсь переварить результаты:

работает или нет? Может кто глянуть?

https://gist.github.com/n-bes/d6a3eb12c49c4c928452556df4bcff33
https://youtu.be/g-WPhYREFjk?t=3416

14 ответов

8 просмотров

На годболт выведи

n- Автор вопроса
Dmytro Polunin
На годболт выведи

Там с рандомом плохо

n- Автор вопроса
Пух
Эээ?

[dependencies] rand = "0.8.4"

n
[dependencies] rand = "0.8.4"

Суть в том чтобы посмотреть asm а для этого и одной функции хватит.

n- Автор вопроса
Dmytro Polunin
На годболт выведи

https://rust.godbolt.org/z/xeP483Mzh

Судя по всему, работает. Только ты неправильно godbolt используешь, туда имеет смысл класть на проверку минимальные куски кода, обозримые, и проверять на хотя бы втором уровне оптимизации (ключ -C opt-level=2). Я проверил на двух вариантах: pub fn sum(conditions: &[bool], values: &[u32]) -> u32 { let mut sum = Wrapping(0); for i in 0..3 { if conditions[i] { sum += Wrapping(values[i]); } } sum.0 } и pub fn sum(conditions: &[bool], values: &[u32]) -> u32 { let mut sum = Wrapping(0); for i in 0..3 { sum += Wrapping((conditions[i] as u32) * values[i]); } sum.0 } Судя по ассемблеру, во втором коде команд перехода существенно меньше, чем во втором.

11,001 ns/iter К слову операции которыя длятся пару тактов смысла бенчить мало - любая фоновая задача в операционке и результаты плывут

n- Автор вопроса

начало топика читал?

n- Автор вопроса
n
начало топика читал?

sorry, ты первый и ответил)

n
начало топика читал?

Да. И если бы ты действительно хотел избавиться от лишних бранчей, то написал как-то так: let values = &values[..500]; let conditions = &conditions[..500]; for i in 0..500 { ...

n- Автор вопроса

Я как-то ожидал, что компилятор по-умнее, и в рамках маленькой функции сможет собрать наиболее оптимизированный код

n
Я как-то ожидал, что компилятор по-умнее, и в рамк...

Не-а. Сообщение о выходе за границы включает в себя ошибочный индекс, поэтому снизить количество проверок до одной компилятор не может, ибо это поменяет наблюдаемое поведение. А вот если сразу заранее отрезать слайс нужного размера, то компилятор уже может доказать, что индекс всегда находится в нужных пределах, выкинуть проверки и векторизовать код

Похожие вопросы

Обсуждают сегодня

я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
короче сгенерила мне эта штука код на ассемблере: struc string val { common local .value dq .value .value: if ~val eq db val end if db 0 } fo...
Vi Chapmann Chapmann
12
Всем привет! Массив вводится с клавиатуры, кол-во элементов неизвестно, поэтому я указал arr db 100 dup(?) С нахождением максимума проблем нет, а вот минимум почему-то всегд...
En Vind Av Sorg
11
кто шарит: mattermost отслеживает что ты на пк запускаешь?
Valentin
13
Помогите, пожалуйста, делаю программу для для подсчёта корней квадратного уравнения, знаю, что есть куча недочётов, недоработок, но основная проблема в том, что почему-то при ...
NYC
13
#include <stdio.h> int main(void) { int n; scanf("%d", &n); int digits1[n] = {0}; int digits2[n] = {0}; я не могу таким образом заранее массив нулями заполнить?
Linus
12
в сях есть множество как в питоне? для удаление дубликатов
Linus
25
читать файл максимально быстро? странный вопрос))
zamtmn
53
я про форму записи. смысл указывать что 8 байтный регистр 8 байт?
Aiwan \ (•◡•) / _bot
10
Вроде бы вопрос уже заезжанный, но тем не менее У меня есть функция menu() которая выводит набор возможных действий, а затем спрашивает у пользователя что он хотел бы сделать....
David Golovatin
5
Карта сайта