170 похожих чатов

Я надеюсь все обновили телегу что бы увидеть код с

разметкой?

Хитрый вопрос! Как думаете, какой код выполнится быстрее?
Первый?

static void calcIndexes(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - ((position[i].x / size_x) * size_x);
std::int32_t y = position[i].y - ((position[i].y / size_y) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Или второй?
static void calcIndexesAutoVectorise(std::int32_t* const out,
const Position* const position,
const std::size_t count,
const std::int32_t size_x,
const std::int32_t size_y)
{
for (std::size_t i = 0; i < count; ++i) {
std::int32_t x = position[i].x - (static_cast<std::int32_t>(static_cast<float>(position[i].x) / static_cast<float>(size_x)) * size_x);
std::int32_t y = position[i].y - (static_cast<std::int32_t>(static_cast<float>(position[i].y) / static_cast<float>(size_y)) * size_y);
if (x < 0) {
x = size_x - std::abs(x);
}
if (y < 0) {
y = size_y - std::abs(y);
}
out[i] = y + x * size_x;
}
}
Можно не вглядываться, они различаются только преобразованиями во float и обратно в инт, в теле цикла.

Ну что думаете? 😝

14 ответов

56 просмотров

судя по постановке вопроса конечно тот что выглядит страшнее

Александр- Автор вопроса

И вы получаете приз за дедукцию! 🥳 Целочисленное деление мешало компилятору векторизовать код! А флоаты не мешают. А разница в скорости выполнения в 4 раза. - 4ms с копейками на 1 000 000 в первом случае против - <1ms во втором (на моей машине разумеется)

Ничего хорошего не думаю https://gcc.godbolt.org/z/oYq6EWM4Y

Александр
Поставь -O3 -march=skylake

Ага, -fvect-cost-model=dynamic влияет

https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html

а тут точно с вычислениями всё в порядке?

Александр- Автор вопроса
Alex Travkin
а тут точно с вычислениями всё в порядке?

Конкретно эту функцию не тестил. Скорее да, чем нет. А что тебе не нравится?

Александр
Конкретно эту функцию не тестил. Скорее да, чем не...

инт 32 бита, а у флоата мантисса меньше 32 бит => не все инты после преобразования туда-обратно сохранят своё значение

Александр- Автор вопроса
Александр- Автор вопроса
Гражданин Котейко
инт 32 бита, а у флоата мантисса меньше 32 бит => ...

А, ничего страшного. У меня память быстрее кончится, чем мантисы не хватит😂

Александр
А, ничего страшного. У меня память быстрее кончитс...

ну тогда ок, просто без контекста об этом проблематично судить

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
Ребят в СИ можно реализовать ООП?
Николай
33
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
2
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
Карта сайта