184 похожих чатов

Всем привет, есть clickhouse (22.1.3.7) из 3 реплик, zookeper кластер

стоит отдельно и состоит из 3 серверов.

на одной из реплик кх ночью отвалилась сессия с zk -
last_queue_update_exception: Code: 999. Coordination::Exception: Session expired (Session expired). (KEEPER_EXCEPTION) (version 22.1.3.7 (official build))

лог с zk -
2022-07-11 22:54:03,374 [myid:2] - INFO [SessionTracker:ZooKeeperServer@398] - Expiring session 0x300000016650005, timeout of 30000ms exceeded
2022-07-11 22:54:03,374 [myid:2] - INFO [SessionTracker:QuorumZooKeeperServer@157] - Submitting global closeSession request for session 0x300000016650005

дальше сделал на ноде кх рестарт реплики таблицы (движок таблицы - ReplicatedCollapsingMergeTree) -
system restart replica database.table;

и вот уже 6 с половиной часов этот запрос выполняется, в system.replication_queue есть 12 строк с
type: MERGE_PARTS
которые не меняются все 6 часов.

по запросу
SELECT
database,
table,
type,
max(last_exception),
max(postpone_reason),
min(create_time),
max(last_attempt_time),
max(last_postpone_time),
max(num_postponed) AS max_postponed,
max(num_tries) AS max_tries,
min(num_tries) AS min_tries,
countIf(last_exception != '') AS count_err,
countIf(num_postponed > 0) AS count_postponed,
countIf(is_currently_executing) AS count_executing,
count() AS count_all
FROM system.replication_queue
GROUP BY
database,
table,
type
ORDER BY count_all DESC
FORMAT Vertical

ответ такой -
Row 1:
──────
database: database
table: table
type: MERGE_PARTS
max(last_exception):
max(postpone_reason):
min(create_time): 2022-03-25 11:50:15
max(last_attempt_time): 2022-06-13 17:53:20
max(last_postpone_time): 1970-01-01 03:00:00
max_postponed: 0
max_tries: 1
min_tries: 1
count_err: 0
count_postponed: 0
count_executing: 12
count_all: 12

мне дальше ждать или предпринимать какие-то действия?

14 ответов

22 просмотра

а progress меняется ? select * from system.merges

я бы перезрузил КХ и я бы обновился до 22.3.8

Александр-Благов Автор вопроса
Denny [Altinity]
а progress меняется ? select * from system.merges

зафиксировал текущие значения progress , проверю через несколько минут

Александр-Благов Автор вопроса
Denny [Altinity]
я бы перезрузил КХ и я бы обновился до 22.3.8

перезагрузка на всех нодах? эта очередь в replication_queue на всех трёх одинаковая

Александр-Благов Автор вопроса
Denny [Altinity]
select * from system.replication_queue

12 строк такого вида - database: database table: table replica_name: node1 position: 11 node_name: queue-0027499653 type: MERGE_PARTS create_time: 2022-06-13 17:53:20 required_quorum: 0 source_replica: node3 new_part_name: 202112_0_420933_299_530665 parts_to_merge: ['202112_0_38524_157_530665','202112_38525_141124_203_530665','202112_141125_200161_179_530665','202112_200162_420933_298_530665'] is_detach: 0 is_currently_executing: 1 num_tries: 1 last_exception: last_attempt_time: 2022-06-13 17:53:20 num_postponed: 0 postpone_reason: last_postpone_time: 1970-01-01 03:00:00 merge_type: REGULAR

Александр-Благов Автор вопроса
Denny [Altinity]
а progress меняется ? select * from system.merges

прошло 25 минут, progress не изменился ни у кого

Александр-Благов Автор вопроса
Denny [Altinity]
рестартуйте КХ

спасибо, пойду пробовать

Александр-Благов Автор вопроса
Denny [Altinity]
рестартуйте КХ

помогло, реплика теперь в строю, но в system.merges остались те же записи, с теми же progress. Но видно что у таблицы ещё много дел для репликации - queue_size: 77 inserts_in_queue: 65 merges_in_queue: 12

Александр Благов
помогло, реплика теперь в строю, но в system.merg...

https://pastila.nl/ надо со всех серверов merges и replication_queueu --> format Vertical

Александр-Благов Автор вопроса
Denny [Altinity]
https://pastila.nl/ надо со всех серверов merges и...

https://pastila.nl/?025630eb/c2017e34405727c22ee74597050be96f

Александр Благов
https://pastila.nl/?025630eb/c2017e34405727c22ee74...

т.е. мержи висят на 100% и не могут завершиться, грепайте лог КХ, я не видел/не понмю такого, скорее всего там ошибки про зукипер

Александр-Благов Автор вопроса
Denny [Altinity]
т.е. мержи висят на 100% и не могут завершиться, г...

спасибо, после нескольких рестартов очередь пришла в прошлое состояние и реплика стала актуальной по данным. а те мержи, которые не могут завершиться, видимо, были ещё до поломки с зк

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Я вот подумал. SSE выполняет операции максимум с 64-битной точностью. А FPU - всегда с 80-битной. Разве не должно быть FPU точнее тогда?
The Bird of Hermes
13
как быть с принтером? такой подход прокатит?
zamtmn
12
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Я не понимаю, это троллинг или что? Швабрика поддерживают, который буквально пишет на ассемблере взаимодействия с винапи. Я это ещё написал загрузчик и хоть что-то изучаю в о...
Shadow Akira
6
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Карта сайта