184 похожих чатов

Есть кластер из двух шардов по 2 реплики, базы -

атомик. Настроили сегодня выгрузку кучи данных из кафки средствами KafkaEngine + MV в Distributed таблицы.
И тут заметил, что в какой-то момент на двух серверах одного шарда уверенно стала расти метрика DistributedFilesToInsert (уже под 5000), хотя на втором - по нулям.

В доке про метрику написано: shows the total number of files in filesystem that are selected to send to remote servers by Distributed tables.

Где-то криво настроены распределённые таблицы? Что это может быть? Куда смотреть?

7 ответов

20 просмотров

system.distribution_queue

Alexey-Sokolov Автор вопроса
Denny [Altinity]
system.distribution_queue

Table is in readonly mode на одном из серверов второго кластера (где очереди нет)

Alexey Sokolov
Table is in readonly mode на одном из серверов вто...

select FQDN() h, count() from clusterAllReplicas('', system.replicas) where is_readonly group by h

Alexey-Sokolov Автор вопроса
Denny [Altinity]
select FQDN() h, count() from clusterAllReplicas('...

Пусто (имя кластера подставил). На всякий случай проверил system.replicas локально на каждом сервере - нигде нет ничего в ридонли.

Alexey Sokolov
Пусто (имя кластера подставил). На всякий случай п...

а где вы нашли Table is in readonly mode тогда ? покажите

Alexey-Sokolov Автор вопроса
Denny [Altinity]
а где вы нашли Table is in readonly mode тогда ? п...

Я сделал select FQDN(), * from clusterAllReplicas('fdp-cluster', system.distribution_queue) t where t.data_files > 0; И увидел две ноды из второго шарда, у которых для распределённой таблицы Events data_files под 7000 и в поле last_exception написано: Code: 242. DB::Exception: Received from chi-clickhouse-replicated-0-0:9000. DB::Exception: Table is in readonly mode (zookeeper path: /clickhouse/tables/fdp/Events_local/shard1). Значения в data_files медленно растут, в system.replicas с признаком is_readonly=1 по-прежнему ничего нет. В какой-то момент мониторинг показал событие init ZK, после чего график по метрике DistributedFilesToInsert пошёл вниз, но вскоре снова начал расти.

Alexey Sokolov
Я сделал select FQDN(), * from clusterAllReplicas(...

в логе КХ того который chi-clickhouse-replicated-0-0 надо смотреть

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта