разметкой?
Хитрый вопрос! Как думаете, какой код выполнится быстрее?
Первый?
static void calcIndexes(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - ((position[i].x / size_x) * size_x);
std::int32_t y = position[i].y - ((position[i].y / size_y) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Или второй?
static void calcIndexesAutoVectorise(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - (static_cast<std::int32_t>(static_cast<float>(position[i].x) / static_cast<float>(size_x)) * size_x);
std::int32_t y = position[i].y - (static_cast<std::int32_t>(static_cast<float>(position[i].y) / static_cast<float>(size_y)) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Можно не вглядываться, они различаются только преобразованиями во float и обратно в инт, в теле цикла.
Ну что думаете? 😝
судя по постановке вопроса конечно тот что выглядит страшнее
И вы получаете приз за дедукцию! 🥳 Целочисленное деление мешало компилятору векторизовать код! А флоаты не мешают. А разница в скорости выполнения в 4 раза. - 4ms с копейками на 1 000 000 в первом случае против - <1ms во втором (на моей машине разумеется)
Ничего хорошего не думаю https://gcc.godbolt.org/z/oYq6EWM4Y
Поставь -O3 -march=skylake
Ага, -fvect-cost-model=dynamic влияет
https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html
Вот это прикол. Не знал, спасибо за науку.
а тут точно с вычислениями всё в порядке?
Конкретно эту функцию не тестил. Скорее да, чем нет. А что тебе не нравится?
инт 32 бита, а у флоата мантисса меньше 32 бит => не все инты после преобразования туда-обратно сохранят своё значение
Имею в виду нижнюю. Верхняя тестировал
А, ничего страшного. У меня память быстрее кончится, чем мантисы не хватит😂
ну тогда ок, просто без контекста об этом проблематично судить
Обсуждают сегодня