читается больше данных чем есть в партиции и мне сказали что видимо я не так понимаю прунинг, немного потестировал и совсем перестал понимать. Может кто то подсказать почему так происходит? Почему с партиционирование читается больше чем без? prewhere тоже не помогает по полям в индексе, и даже если явно указать выражение партиционирования в where и задать ему конкретное значение, ничего не меняется.
https://gist.github.com/rabidka/17641fff27c9495ebea21c7ce40d75cb
в последней версии такого нет, по модулю тоже отсекает... Пойду обновляться
PARTITION BY (toString(toYYYYMMDD(eventTs)),modulo(ip,256)) ну да прунинг в 20.6 так не работает. в парты записано max и min значение поля ip , т.е. в каждом парте будет от нуля до макс ip ,modulo(ip,256) -- никуда не записано !!!!! прунер берет и сканирует парты и находит что во всех партах есть ip между min и max в Amos это исправил, но еще кажется не зарелизилось https://github.com/ClickHouse/ClickHouse/pull/16253
Обсуждают сегодня