оптимизаций производительности? (в частности, по heap)
Наблюдаю существенное повышение аллокаций в хипе (428MB -> 1.9GB), если выношу функцию в общий модуль:
getOr :: (PrimMonad m, VUM.Unbox v) => v -> MVec2 m v -> XY -> m v
Добавление прагм в общем модуле:
{-# INLINE getOr #-}
...понижает аллокации до 532MB. Хочется добить до 438MB.
Собираю всё эксперименты с - -O2.
Есть какие-то идеи, что ещё можно попробовать?
Update: добавление прагмы:
{-# SPECIALISE getOr :: Bool -> MVec2 IO Bool -> XY -> IO Bool #-}
... не меняет картину.
да вроде всё поинлайнено https://github.com/oshyshko/adventofcode/blob/master/src/MVec2.hs#L28-L33 xy2i тоже https://github.com/oshyshko/adventofcode/blob/master/src/XY.hs#L33-L35 Или я что-то упускаю?
INLINE означает "обязательно заинлайнь если применена к стольким аргументам, сколько дано слево от знака равно в определении, а иначе на усмотрение компилятора". У вас в lhs три аргумента, а используется с двумя, так что INLINE если и работает, то не сразу, а только после того как там mapM соптимизируется. Попробуйте заменить определение на getOr :: (PrimMonad m, VUM.Unbox v) => v -> MVec2 m v -> XY -> m v getOr orV (MVec2 wh@(XY w h) vec) = \xy@(XY x y) if x < 0 || y < 0 || x >= w || y >= h then return orV else VUM.read vec (xy2i wh xy) {-# INLINE getOr #-}
Обсуждают сегодня