Я надеюсь все обновили телегу что бы увидеть код с

Question

Я надеюсь все обновили телегу что бы увидеть код с

разметкой?

Хитрый вопрос! Как думаете, какой код выполнится быстрее?
Первый?

static void calcIndexes(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - ((position[i].x / size_x) * size_x);
std::int32_t y = position[i].y - ((position[i].y / size_y) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Или второй?
static void calcIndexesAutoVectorise(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - (static_cast<std::int32_t>(static_cast<float>(position[i].x) / static_cast<float>(size_x)) * size_x);
std::int32_t y = position[i].y - (static_cast<std::int32_t>(static_cast<float>(position[i].y) / static_cast<float>(size_y)) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Можно не вглядываться, они различаются только преобразованиями во float и обратно в инт, в теле цикла.

Ну что думаете? 😝

#c++ #embedded #programming #russian

0

04.11.2023

14 ответов

91 просмотр

Александр Автор вопроса

И вы получаете приз за дедукцию! 🥳 Целочисленное деление мешало компилятору векторизовать код! А флоаты не мешают. А разница в скорости выполнения в 4 раза. - 4ms с копейками на 1 000 000 в первом случае против - <1ms во втором (на моей машине разумеется)

0

04.11.2023

Dmitriy [Отпуск]

Ничего хорошего не думаю https://gcc.godbolt.org/z/oYq6EWM4Y

0

04.11.2023

Александр Автор вопроса

Dmitriy [Отпуск]
Ничего хорошего не думаю https://gcc.godbolt.org/z...

Поставь -O3 -march=skylake

0

04.11.2023

Dmitriy [Отпуск]