170 похожих чатов

Я надеюсь все обновили телегу что бы увидеть код с

разметкой?

Хитрый вопрос! Как думаете, какой код выполнится быстрее?
Первый?

static void calcIndexes(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - ((position[i].x / size_x) * size_x);
std::int32_t y = position[i].y - ((position[i].y / size_y) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Или второй?
static void calcIndexesAutoVectorise(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - (static_cast<std::int32_t>(static_cast<float>(position[i].x) / static_cast<float>(size_x)) * size_x);
std::int32_t y = position[i].y - (static_cast<std::int32_t>(static_cast<float>(position[i].y) / static_cast<float>(size_y)) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Можно не вглядываться, они различаются только преобразованиями во float и обратно в инт, в теле цикла.

Ну что думаете? 😝

14 ответов

28 просмотров

судя по постановке вопроса конечно тот что выглядит страшнее

Александр- Автор вопроса

И вы получаете приз за дедукцию! 🥳 Целочисленное деление мешало компилятору векторизовать код! А флоаты не мешают. А разница в скорости выполнения в 4 раза. - 4ms с копейками на 1 000 000 в первом случае против - <1ms во втором (на моей машине разумеется)

Ничего хорошего не думаю https://gcc.godbolt.org/z/oYq6EWM4Y

Александр- Автор вопроса
Александр
Поставь -O3 -march=skylake

Ага, -fvect-cost-model=dynamic влияет

Александр- Автор вопроса

https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html

а тут точно с вычислениями всё в порядке?

Александр- Автор вопроса
Alex Travkin
а тут точно с вычислениями всё в порядке?

Конкретно эту функцию не тестил. Скорее да, чем нет. А что тебе не нравится?

Александр
Конкретно эту функцию не тестил. Скорее да, чем не...

инт 32 бита, а у флоата мантисса меньше 32 бит => не все инты после преобразования туда-обратно сохранят своё значение

Александр- Автор вопроса
Александр- Автор вопроса
Гражданин Котейко
инт 32 бита, а у флоата мантисса меньше 32 бит => ...

А, ничего страшного. У меня память быстрее кончится, чем мантисы не хватит😂

Александр
А, ничего страшного. У меня память быстрее кончитс...

ну тогда ок, просто без контекста об этом проблематично судить

Похожие вопросы

Обсуждают сегодня

читать файл максимально быстро? странный вопрос))
zamtmn
50
всем привет! углубившись в плюсы и начав изучать реверсинг понял, что без асм'а никуда со своими высокоабстрактными представлениями начал изучать механизмы асма, и не совсем п...
9
буквально один оставшийся вопрос при выполнении строчки mov eax, 5 операнд "5" будет присутствовать где-либо в памяти (любой), кроме как в памяти блока .code? подвопрос: как...
12
Всем ку. Подскажите, если задекларировал массив так: int arr[10] = {1, 2, 3, 4}, то в arr[4] будет мусор или нуль?
Sasha K
14
я не понимаю mov [r11+8],rcx и прочие. мы записываем значение из rcx, куда?
Bor
15
у меня такой вопрос про память в x86 возник, может кто пояснить?.. у процессора есть (как минимум) 3 типа адресов (названия "п1", "п2", "п3" --- мои, чтобы проще было дальше)...
Toideng
5
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
А какие расширения активно используются в промышленности? Именно идейные, по типу гадт, а не всякие оверлоадедстрингс
Степан
11
у процессора есть (как минимум) 3 типа адресов (названия "п1", "п2", "п3" --- мои, чтобы проще было дальше): - "п1" --- виртуальный адрес, то есть тот, который ресолвится в "п...
Toideng
3
Guys Who’s kurdish on this group?
Hiwa Amiri
11
Карта сайта