(SELECT 1 FROM table GROUP BY x)
3) ...
Посмотрите время?)
Насколько я знаю, если x в lowcardinality, то лучше group by.
первый вариант будет быстрее и экономнее по памяти второй вариант фактически вы дважды делаете AggregationTransform (второй раз для coun() EXPLAIN PIPELINE SELECT uniqExact(x) FROM default.test Query id: ec6e8db0-ab3e-4366-b7a0-5d687581c7f0 ┌─explain──────────────────────────┐ │ (Expression) │ │ ExpressionTransform │ │ (Aggregating) │ │ AggregatingTransform │ │ (Expression) │ │ ExpressionTransform │ │ (SettingQuotaAndLimits) │ │ (ReadFromPreparedSource) │ │ NullSource 0 → 1 │ └──────────────────────────────────┘ EXPLAIN PIPELINE SELECT count() FROM ( SELECT 1 FROM default.test GROUP BY x ) Query id: e96c611c-a67e-44b8-ad85-f72a8aa087f1 ┌─explain──────────────────────────────┐ │ (Expression) │ │ ExpressionTransform │ │ (Aggregating) │ │ AggregatingTransform │ │ (Expression) │ │ ExpressionTransform │ │ (Aggregating) │ │ AggregatingTransform │ │ (Expression) │ │ ExpressionTransform │ │ (SettingQuotaAndLimits) │ │ (ReadFromPreparedSource) │ │ NullSource 0 → 1 │ └──────────────────────────────────────┘
https://github.com/ClickHouse/ClickHouse/issues/16533 вообще uniqExact в некоторых случаях медленнее GROUP BY
о, не знал об этом, спасибо
нет однозначного ответа , зависит от данных иногда будет это быстрее иногда то про память https://github.com/ClickHouse/ClickHouse/issues/7895
Обсуждают сегодня