вида select .. from distributed_table PREWHERE dt IN (select max(dt) from distributed_table) WHERE ... При замене IN на GLOBAL IN запрос перестает возвращать данные. Если убрать секцию where, либо переместить условия из prewhere в where, то все работает. В чем может быть причина? настройка distributed_product_mode = 'allow'. попытался воспроизвести ситуацию: create table default.l_table on cluster {cluster} (id UInt64, val String, dt Date)
engine = MergeTree()
partition by toYYYYMM(dt)
order by id
settings index_granularity = 8192;
create table default.d_table on cluster {cluster} (id UInt64, val String, dt Date)
engine = Distributed('cluster3', 'default', 'l_table', id);
insert into default.d_table
select
intDiv(rand32(), 10000) as id
,any(randomPrintableASCII(10))
,any(toDate('2020' || substring(toString(toDate(rand32())), 5)))
from numbers(1000000)
group by
id;
select count() from d_table
prewhere toYYYYMM(dt) global in (select min(toYYYYMM(dt)) from d_table)
where position(val,':') > 0
settings distributed_product_mode = 'allow';
даже сложно сказать баг ли это. Возможно это просто особенность, какая версия КХ? >prewhere toYYYYMM(dt) global in (select min(toYYYYMM(dt)) from d_table) если все это ради partition pruning , то это все немного не то.
Версия 20.8.2.3. Да, prewhere для partition pruning, а global для сокращения числа запросов, т.к в подзапросе distributed-таблица
ну да, скорее баг, открыл https://github.com/ClickHouse/ClickHouse/issues/15792
причем похоже раньше работало, наверное исходя из этого можно считать это багом
Обсуждают сегодня