170 похожих чатов

Я надеюсь все обновили телегу что бы увидеть код с

разметкой?

Хитрый вопрос! Как думаете, какой код выполнится быстрее?
Первый?

static void calcIndexes(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - ((position[i].x / size_x) * size_x);
std::int32_t y = position[i].y - ((position[i].y / size_y) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Или второй?
static void calcIndexesAutoVectorise(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - (static_cast<std::int32_t>(static_cast<float>(position[i].x) / static_cast<float>(size_x)) * size_x);
std::int32_t y = position[i].y - (static_cast<std::int32_t>(static_cast<float>(position[i].y) / static_cast<float>(size_y)) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Можно не вглядываться, они различаются только преобразованиями во float и обратно в инт, в теле цикла.

Ну что думаете? 😝

14 ответов

60 просмотров

судя по постановке вопроса конечно тот что выглядит страшнее

Александр- Автор вопроса

И вы получаете приз за дедукцию! 🥳 Целочисленное деление мешало компилятору векторизовать код! А флоаты не мешают. А разница в скорости выполнения в 4 раза. - 4ms с копейками на 1 000 000 в первом случае против - <1ms во втором (на моей машине разумеется)

Ничего хорошего не думаю https://gcc.godbolt.org/z/oYq6EWM4Y

Александр
Поставь -O3 -march=skylake

Ага, -fvect-cost-model=dynamic влияет

https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html

а тут точно с вычислениями всё в порядке?

Александр- Автор вопроса
Alex Travkin
а тут точно с вычислениями всё в порядке?

Конкретно эту функцию не тестил. Скорее да, чем нет. А что тебе не нравится?

Александр
Конкретно эту функцию не тестил. Скорее да, чем не...

инт 32 бита, а у флоата мантисса меньше 32 бит => не все инты после преобразования туда-обратно сохранят своё значение

Александр- Автор вопроса
Александр- Автор вопроса
Гражданин Котейко
инт 32 бита, а у флоата мантисса меньше 32 бит => ...

А, ничего страшного. У меня память быстрее кончится, чем мантисы не хватит😂

Александр
А, ничего страшного. У меня память быстрее кончитс...

ну тогда ок, просто без контекста об этом проблематично судить

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Карта сайта