и решения ни у одного нет , как понять почему кх считает некоторые реплики не активными и не выполняет на них запросы on cluster ?
@milovidov_an а может подскажете куда копать если он кластер не выполняется на втором шарде, сперва подумал в версии проблема, накатил ансиблом аналогичный тестовый стенд все выполняется он кластер без проблем , в system.clusters все реплики есть , порты все открыты клиентом и телнетом между серверам все коннектит , но на первом шарде запросы он кластер выполняются , даже если его запустить на репликах второго шарда, а на втором дает таймаут, при этом ошибок в еррор логе кх нет никаких на всех репликах , уже даже не знаю в какую сторону копать
↘️ Progress: 2.00 rows, 116.00 B (1.69 rows/s., 97.88 B/s.) 49%Received exception from server (version 18.12.17):
Code: 159. DB::Exception: Received from localhost:9000, 127.0.0.1. DB::Exception: Watching task /clickhouse/task_queue/ddl/query-0000000015 is executing longer than distributed_ddl_task_timeout (=180) seconds. There are 2 unfinished hosts (0 of them are currently active), they are going to execute the query in background.
если проблема серьезная и болит, продублируйте сюда с описанием как воспроизвести - https://github.com/yandex/ClickHouse/issues
А что написано в конфигурации серверов про <distributed_ddl> (у меня например на одном сервере конфигурация по умолчанию тянулась с какой-то старой версии КХ, где часть настроек отсутствовала)? И что в логах про DDLWorker?
Обсуждают сегодня