сжатие. Если у нас дефолтные настройки, будет ли сжатие данных на диске?
<compression incl="clickhouse_compression">
<case>
<min_part_size>10000000000</min_part_size>
<min_part_size_ratio>0.01</min_part_size_ratio>
<method>zstd</method>
</case>
</compression>
Вообще возможно как то "упаковать" данные на диске, чтобы они меньше места занимали?
Будет
Правильный order by +encoding иногда может зарешать. Надо знать данные
там тупо логи лежат
по умолчанию пакует LZ4 https://clickhouse.tech/docs/ru/sql-reference/statements/create/table/#codecs вот тут можно почитать про кодаки сжатия, иногда можно ооооочень эффективно пожать поигравшись кодаками индивидуально для столбцов
а эффективность текущего сжатия какая?
Текстовые? Тогда только увеличить степень компрессии zstd
SELECT database, table, name, compression_codec, round(sum(data_compressed_bytes) / 1024/1024/1024, 2) as size_gb, round(sum(data_uncompressed_bytes) / 1024/1024/1024, 2) as size_uncompressed_gb, round(size_gb/size_uncompressed_gb*100,2) perc FROM system.columns GROUP BY database,table, name, compression_codec HAVING size_gb>0.1 ORDER BY name ASC,table ASC
Можно уже к существующим таблицам менять кодек?
можно к существующим полям
ALTER TABLE.. MODIFY COLUMN смотрите в доке
не помогут вам кодеки особо на лог-текстовых полях
Syntax error: failed at position 1 ('round'):
можно попробовать какой нить LZ4HC(9+), ну и логи бывают очень кардинальными )
У меня точно такая же нога и она не болит)
LZ4HC - это не кодек, это компрессия, и то лучше как я сказал zstd>10... короче надо взять набор данных и делать бенчмарк
ну да, в любом случае надо пробовать
Обсуждают сегодня