group by , а не просто запрос уходил на одну из реплик полностью? например по месяцам если таблица партицирована, по два месяца на каждом шарде, 3 шарда и чтобы один месяц на каждой реплики процессился
allow_experimental_parallel_reading_from_replicas=true в свойства профила поставьте и max_parallel_replicas=2 в SETINGS в query должно сработать https://github.com/ClickHouse/ClickHouse/pull/29279
спасибо, поставил allow_experimental_parallel_reading_from_replicas = 1 и max_parallel_replicas = 2 и почему-то просканило 42 млрд строк вместо 21 млрд из distributed таблички. Хуже стало получается. Как он вообще просканил в 2 раза больше строк, чем есть в таблице всего.
ну логично что получилось значение помноженное на max parallel replicas
я думал что в связке с allow_experimental_parallel_reading_from_replicas оно должно как то по партициям бить на реплики и сканить в сумме один раз. И ускорять запрос, а не замедлять его
Обсуждают сегодня