отношение сколько будет занимать аналогичная таблица в постгрес и в клике?
очень сильно зависит от кол-ва уникальных значений в столбцах
в среднем где-то в 10 раз сжимает, будет зависить от типов и гранулярности. Очевидно что колонка с UUID сожмётся не так хорошо
и еще будет зависеть от распределения значений в колонке. если колонка отсортирована в составе sorting key, то значит одинаковые данные будут лежать в партах рядом друг с другом и сожмутся еще лучше
да LZ4 > В принципе интересует отношение сколько будет занимать аналогичная таблица в постгрес и в клике? типа надо угадать, ок, я кубик бросил, получилось 2, в два раза сожмет
https://clck.ru/sKkmT
Если хотите конкретный опыт услышать, то я как раз мигрировал схему из слоника, на тестовом наборе данных (fact-таблицах, размером 200-400 млн строк) у меня «сжатие» было в 4-5 раз лучше, чем в посгре, на самых первых версиях, дальше конечно можно поиграться с codec-ами, типами данными и т.д. Уверен, что можно сделать лучше, опыт пока у меня с кликом не велик Все конечно же зависит от многих факторах
начинали так же с движка матпредставления?
Я начинал с семейств merge tree, думаю это классика с чего стоит начать или я вопрос не совсем верно понял?
Обсуждают сегодня