Как они хранятся в целом?
2. Во сколько раз должно быть меньше строк после группировки, чтобы выиграть по занимаемому дисковому пространству ?
3. Есть ли смысл сжимать столбцы с агрегатными функциями ZSTD например ?
1. имхо только в исходниках, я думаю хитро хранятся только uniqState, остальное попроще. 2. обычно задача уменьшить кол-во строк, раз в 10 минимум, чтобы ускорить выполнение запросов. Т.к. при этом автоматически уменьшается кол-во полей, то выигрыш обычно раз 10 минимум, естественно если тоже самое(строки и поля), сохранить в обычной таблице, то будет примерно тоже самое, или чуть меньше. SummingMergeTree стейтов не хранит поэтому он занимает меньше. 3. ZSTD всегда все жмет лучше, просто жрет больше цпу. ну и с uniq-ми например разницы нету https://gist.github.com/den-crane/32cac4f069f4227b35ab86553bbc649b
Обсуждают сегодня