CH. min_part_size и min_part_size_ratio проверяются с условием AND или OR?
Перелили 700 ГБ сырых данных из Vertica с кастомным партицированием по неделям. сжалось только на 10%. В вертике сжимает В три(3) раза 😞
наши параметры:
<clickhouse_compression>
<case>
<min_part_size>100000000</min_part_size>
<min_part_size_ratio>0.01</min_part_size_ratio>
<method>lz4</method>
</case>
</clickhouse_compression>
Мержи точно прошли и остановились?
Проверяются с условием AND. По дефолту компрессия lz4, а значит такие параметры, как у вас, ничего не должны менять. Эти настройки имеет смысл устанавливать, чтобы попробовать zstd (только на больших кусках, или вообще на всех). Можно ещё попробовать покрутить схему данных (используемые типы и выражение сортировки).
Обсуждают сегодня