мифы, засевшие в голове про кучу:
1) Выделить nRows блоков размером nCols * sizeof(T) при помощи std::malloc
2) Выделить один блок размером nRows * nCols * sizeof(T)
Что быстрее и как понять? Я тут читаю про менеджеры кучи и понимаю что они выделяют по 4 МБ а затем просто мелкие объекты в этих 4 МБ выделяют.
Аллокаторы и хипы по разному могут работать. Как -- не определено.
Короче Всё зависит от аллокатора На примере jemalloc'a у него есть подсистема малых и больших аллокаций Малые аллокации - до нескольких мегабайта (вроде как) и имеют определённые кратности Когда ты делаешь запрос блока данных, если он входит в систему маленьких аллокаций, аллокатор пытается тебе вернуть уже ранее заалоцированный объект, причём его размер будет равен ближайшему размеру блока. Если у малой подсистемы нет свободных блоков - она запрашивает большой кусок у подсистемы больших аалокаций, который в случае пустой арены лезет в mmap за куском памяти, возвращает в малую подсистему, где он уже пилится на части
В общем, чем меньше аллокаций и чем более крупные, тем быстрее, но тут только за счёт того (хотя бы) что ты вместо 100 (скажем ) вызовов делаешь 1. Ну и да, аллокация дорогая достаточно. (но не так чтобы совсем уже упарываться по её опримизации)
Обсуждают сегодня