170 похожих чатов

Есть задача на сжатие файла с использованием параллельных потоков, думал

над тем, как сделать это оптимально и пришел к такой последовательности действий:

1) берется кол-во доступных ядер, столько будет потоков (допустим 6 ядер)
2) берется размер файла (допустим 6000 мегабайт)
3) файл разбивается на 6 блоков (столько позволяет количество ядер)
4) размер каждого блока определяется в зависимости от оперативной памяти, допустим при 6000 мегабайт оперативы это выйдет по ~800 мб оперативки на блок (400 мб под сам блок и + столько же для хранения результата сжатия), то есть в сумме это займет 4800 оперативки и немножко останется для благополучной работы системы.
5) после чего результаты сжатия в каждом блоке поочередно записываются в файл, тут уже все зависит от HDD и потоками играться наверное не получиться для достижения скорости

верный ли такой подход или есть какие-то ошибки?

2 ответов

6 просмотров

Пара моментов: 1. В итоговом файле нужно ещё указать, где начало отдельных частей. 2. А лучше всего погуглить параллелизуемый алгоритм сжатия или самому найти из существующих самый хорошо параллелизующийся. Это для того, чтобы не пришлось делать N разных частей с разными словарями в итоговом файле, да и суммарный размер, подозреваю, будет меньше.

Главное не пытаться параллельно читать/писать с HDD. Кодировать/декодировать в оперативке параллельно вполне можно

Похожие вопросы

Обсуждают сегодня

Типа вызывать GetParent и проверять на соответствие GetModuleHandle?
The Bird of Hermes
67
Всем привет! Кто нибудь парсил в ручную JSON без библиотек и фреймворков? Есть может ссылки на оптимальный алгоритмы работы с текстом и примеры таких парсеров?
Lem
27
Do any of you guys have interesting projects one could join? I'm a Middle Full-Stack developer (JS/TS, React & Node)
Lev Shapiro
40
Есть сайт. Там была древняя версия эво. Стоял плагин, который каждый коммент в Jot делал отдельной страницей. После обновления все слетело, теперь старница открывается отдельн...
Artem
1
$res = json_decode($наша строка из респонса); $res1 = array_map(fn($o) => $o->name, $res->breadcrumbs[0]->entities); Как такое будет на Хаскеле?.. В начале весь джейсон, в ко...
Хаскель Моисеевич Гопник
27
Вопрос по диагностике ошибок (я знаю в чем, в данном конкретном примере, я знаю, как исправить, пример модельный, понятно, что в реальности бывает намного запутаннее). module...
ⰄⰎⰋⰐⰐⰑⰛⰤⰧⰧⰩⰄ ⰊⰑⰁⰓⰡⰛⰦⰕⰫ
11
А чем вам питонисты не угодили?😂
.
79
В чем сила брат, в NASM или FASM?
Isaac Kleiner
18
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
52
Приветствую всех. Хочу начать изучать код для программирования микроконтроллеров и не пойму с чего начать. То ли с Си, то ли с плюсов. Чем языки вообще различаются. С чего мож...
Андрей
7
Карта сайта