атомик. Настроили сегодня выгрузку кучи данных из кафки средствами KafkaEngine + MV в Distributed таблицы.
И тут заметил, что в какой-то момент на двух серверах одного шарда уверенно стала расти метрика DistributedFilesToInsert (уже под 5000), хотя на втором - по нулям.
В доке про метрику написано: shows the total number of files in filesystem that are selected to send to remote servers by Distributed tables.
Где-то криво настроены распределённые таблицы? Что это может быть? Куда смотреть?
system.distribution_queue
Table is in readonly mode на одном из серверов второго кластера (где очереди нет)
select FQDN() h, count() from clusterAllReplicas('', system.replicas) where is_readonly group by h
Пусто (имя кластера подставил). На всякий случай проверил system.replicas локально на каждом сервере - нигде нет ничего в ридонли.
а где вы нашли Table is in readonly mode тогда ? покажите
Я сделал select FQDN(), * from clusterAllReplicas('fdp-cluster', system.distribution_queue) t where t.data_files > 0; И увидел две ноды из второго шарда, у которых для распределённой таблицы Events data_files под 7000 и в поле last_exception написано: Code: 242. DB::Exception: Received from chi-clickhouse-replicated-0-0:9000. DB::Exception: Table is in readonly mode (zookeeper path: /clickhouse/tables/fdp/Events_local/shard1). Значения в data_files медленно растут, в system.replicas с признаком is_readonly=1 по-прежнему ничего нет. В какой-то момент мониторинг показал событие init ZK, после чего график по метрике DistributedFilesToInsert пошёл вниз, но вскоре снова начал расти.
в логе КХ того который chi-clickhouse-replicated-0-0 надо смотреть
Обсуждают сегодня