же как подсчитать объем для индексов отдельно?
посчитать объем ваших сырых данных без сжатия можете? коэффициент сжатия в clickhouse обычно в районе x5 вот так примерно и считайте если надо прямо точно то вставляйте данные живые и потом через system.disk и system.parts делайте запросы по которым сможете понять когда диск заполнится всякие системы мониторинга сейчас не плохо научились предсказывать через сколько времени диск заполнится https://www.zabbix.com/documentation/current/ru/manual/config/triggers/prediction https://github.com/nfrumkin/forecast-prometheus
https://clickhouse.tech/docs/en/operations/system-tables/parts/ https://clickhouse.tech/docs/en/operations/system-tables/disks/
В дополнение к рекомендации Slach выше добавлю, что в случае если на кону что-то серьёзное - sizing для будущего продуктива или типа того, то всё же стоит на практике проверять. Слишком много всего влияет на результат, чтобы теоретической прикидкой получилось бы более-менее точно угадать. Один лишь порядок полей в ORDER BY основной таблицы фактов (если схема данных у вас ещё не установилась) может радикально, в разы изменить сжатие данных. Причём стоит вдумчиво определять какие параметры тестового стенда должны соответствовать реальным. Так если вы в свою схему будете загружать небольшую выборку данных (по сравнению с размером, который эти же данные занимали бы для полной партиции), то может получиться отличающийся коэффициент сжатия. То есть по-хорошему для проверки должно быть не "загрузить 1 млн записей и посмотреть средний размер записи", а, например, "загрузить пару дней реальных данных в случае toYYYYMMDD партиционирования"
Обсуждают сегодня