Ок, а такой момент - мне надо будет выбрать количество уникальных записей в интервале ОТ и ДО + учет территории, и этот интервал может быть даже равен всей таблице. Получается, здесь minmax уже не поможет, будет идти full scan, и выборка может быть долгой, верно? Или же все таки из-за того, что территория будет первой в order by, выборка будет быстрой?
заметной разницы для выборки между "территория как ключ партиционирования" и "территория на первой позиции в индексе" не будет. нужные гранулы строк для территории всегда будет выбираться быстро, либо за счет minmax партиции, либо за счет индекса. можете проверить это, сделав две тестовые таблицы с разными подходами, и натравить на них explain indexes = 1 select ... where territory = ...
вот здесь я с вами не соглашусь, поскольку количество большое количество партиций (при высоком cardinality колонки) влияет на перформанс, а в случае индекса - нет. https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/custom-partitioning-key/
так мы говорили про случай в 90 значений извращения в виде партиционирования по high-cardinality значениям — это другой вопрос ) человек волновался, что в его случае при переходе с партиций на индекс просядет выборка за счет большего количества сканов, я объяснил, почему не просядет
ok, сорри не увидел про 90 ))
Обсуждают сегодня