один раз, и он не статический.
[[gnu::always_inline]]
value_t
inline __attribute__((always_inline))
data_to_val_aux(size_t index, size_t swath_length)
{...}
Он в цикле вызывается много раз (538 229 983).
Я измеряю время выполнения, это где-то 9.3 секунд.
Флаги компиляции: -mtune=native -march=native -mavx2 -pipe -g -O3 -DNDEBUG. Вот эти флаги пробовал выключать и включать: -fearly-inlining -finline-limit=10000000 -funit-at-a-time.
Теперь я беру, и руками делаю инлайн этого метода. Результат - 5.4 секунды. Собственно вопрос: как сделать так, что бы инлайн работал?
Для начала посмотреть, что в обоих случаях было сгенерировано
И да - не скажу за реализацию gcc, но шланг с атрибутом always_inline инлайнит всегда, если может. А inline просто тюнит thresholds
а реализация этого метода видна в месте вызова? а если по-другому то вопрос стоит так: где находится этот метод, в заголовочном файле или другом translation unit? а то может тебе просто не хватает LTO
Обсуждают сегодня