если у нас в одной партиции максимум 10к уникальных значений, но по всем партициям 250к уникальных значений, то это плохо?
LowCardinality просто дает гораздо более эффективное сжатие, поэтому хочется использовать его, но есть риск что со временем кол-во уникальных значений превысит рекомендованные 100к
1. По умолчанию LowCardinality имеет ограничени на уникальное значение, после того как лимит закончится, clickhouse начнёт писать без LowCardinality 2. Вы указали количество уникальных значений в партициях, но не указали сколько у вас строк в партиции
Строк в партиции от 5млн до 1млрд.
Я думаю, что будет норм
Например есть видео от Алексея, в котором всех авторов коммитов на GitHub запихивает в LowCardinality https://youtu.be/y8HsXqQEyfE?t=886
спасибо. Мне кажется единственный вариант при котором будут проблемы, это если есть какое-то общее хранилище лоукардиналити в каком-то отдельном месте. Т.е. если лоукардиналити хранятся на уровне партиций/кусков... то всё должно быть супер эффективно
https://youtu.be/rqf-ILRgBdY вот видео от создателя
Обсуждают сегодня