where.
если у меня партиции по датам и я
- делаю where date between (2 months or 6 months)
- делаю where date in (60 separate dates or 180 dates?)
на сколько значимо будет в производительности отличаться?
После чтения с диска CH уберет этот where из дальнейших фильтров? Есть ли инструмент визуального анализа исполнения плана запроса чтобы такие глупые вопросы больше не задавать =) ?
https://clickhouse.com/docs/en/sql-reference/statements/explain/
у КХ вся мета-информация про все парты в памяти, КХ знает мин и макс значения для колоконок по которым партиционировано и это в памяти 1 partition pruning случается в самом начале, все в памяти. 2 primary index тоже в памяти целиком, проходим по индексу находим какие гранулы надо читать 3 если колонки есть котрые передвинуты в preweher - читаем их файлы отсекаем лишние гранулы 4 читаем остальные колонки по фильтрованным prewhere гранулам, фильтруем остальное и снова prewhere фильтры проверяются все, возможно что некоторые условия проверятся до 3х раз, на шагах 1, 3, 4.
вот это прям крутое разъяснение =)
3. специально не делали, а он не сам это делать будет по ПК? 4. прям вот то, что искал, да, то есть фильтры всегда все. спасибо!
в prewhere перемещаются колонки которые не в PK https://github.com/ClickHouse/ClickHouse/issues/41101
Обсуждают сегодня