170 похожих чатов

Снова пространный вопрос про аллокаторы. О статистике. Предположим, аллокатор должен

активно выделять-освобождать строки 1...50КБ. Некий однопоточный аллокатор "общего назначения" с неизвестным заранее распределением запросов.
Какой процент памяти считается нормальным выкинуть впустую на незанятые куски блоков, оверхед и прочее? Скажем 85.5% памяти использовать с пользой в таком случае - сильно плохой результат?

7 ответов

33 просмотра

я бы сказал - малодостижимый :)

Вопрос на небольшое научное исследование. А может и на большое.

pavel- Автор вопроса
Bulat Ziganshin
я бы сказал - малодостижимый :)

Запилил несложную идею и она показала этот результат. Идея такая: 1. Выделяем только фиксированные куски от 16 байт с шагом 16 байт. 2. Для каждого размера на старте создаём пустую "таблицу блоков" - Table. Table - пустой массив из, скажем, 4-8 поинтеров на блоки, плюс "next" (показать на новую Table, когда эта кончится). Всего 3199 Table для шага 16 (кажется) (от 16 до 1024*50 байт). 3. На запрос alloc: определить индекс нужной Table . Ну то есть, до 16 байт - это 0, до 32 байт - это 1 и т.п. Этакий "класс запроса". 4. Лезем в Table, бежим по блокам в ней. В начале там пусто, так что создаём первый блок и кладём туда. Но если говорить о том, что там не пусто, то это фуллскан. Тут для скорости аллокаций возможны приколы с перемешиванием этих поинтеров в Table потом, сейчас не суть. 5. Block порублен ровно на 512 кусков своего размера. Ну то есть, Block класса 0 имеет размер 512 * 16. В начале блока лежит таблица из 512 бит (прибавьте 64 байта к размеру блока, да). Влезает в кеш-линию - получается достаточно бесплатно делать с ней что хочешь. Это маркеры занятости сегментов. 1 - свободно. С помощью какой-нибудь gcc-buitin находилки самого младшего единичного бита в машинном слове или вообще с помощью наркомании AVX можно в блоке быстро найти где у него свободная дыра и туда сесть. 6. В целом архитектура такая: на старте лежат много Table - своя под каждый размер. Каждая Table показывает на массу Block-ов своего размера. Если в Table массив, то при последовательных аллокациях он склонен содержать в начале занятые блоки, поэтому можно иногда тасовать этот массив, но если деаллокации в природе существуют, то дырок понаделается естественным путём. 7. Память конечна, а удаления блоков разных классов не предусмотрено - против фрагментации "реальной кучи" тут приёма не придумано. Предполагается, что стартовый прогрев определяет некое распределение. Далее, если всё же нужны какие-то "классы размеров", которых раньше было недостаточно, то надо думать. Можно начать выделять классы бОльшего ближайшего доступного размера. Возможно можно создать два экземпляра аллокатора и в какой-то момент перелить из старого в новый, грохнув старый с забыванием старого неактуального распределения.

pavel
Запилил несложную идею и она показала этот результ...

если я правильно понял, то при выделении исключительно 1-байтных блоков степень использования ОЗУ будет 6.25%. т.е. мы с вами видимо по разному понимаем "85.5% памяти использовать с пользой"

pavel- Автор вопроса
Bulat Ziganshin
если я правильно понял, то при выделении исключите...

Под исключительно 1-байтные блоки наступит хрень, конечно, да. Речь шла конечно про желание хранить много "строк здорового человека" непредсказуемой длины, а не про атаки на аллокатор.

pavel
Под исключительно 1-байтные блоки наступит хрень, ...

Если потребление памяти скачкообразное, любой аллокатор будет сильно фрагментирован и будет иметь низкую эффективность между пиками, потому что долгие аллокации не смогут быть собраны в один блок, так как большую часть блока будут занимать быстрые аллокации. Кроме того размер аллокаций распределен очень неравномерно. Типично что аллокаций небольшого размера на порядки больше. Кроме того многие размеры блоков скорее всего не встретятся. Поэтому аллокаторы обычно делают шаг между допустимыми размерами аллокации больше по мере роста размера аллокации.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Карта сайта