184 похожих чатов

Здравствуйте, подскажите, пожалуйста, пытаюсь изменить ttl на кластере и возникает

ошибка:

ALTER TABLE jaeger_index_local ON CLUSTER test_cluster_two_shards MODIFY TTL now() + toIntervalDay(14)
>>> Cannot execute replicated DDL query, maximum retries exceeded
Полагаю, что это связано с тем, что уже есть очередь на alter + из-за того, что утеряны некоторые parts, удалены в кх, но остались в кипере... в логах спамят следующие ошибки:
2022.09.07 20:11:35.691972 [ 251 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): No replica has part covering 20220722_128257_128274_4 and a merge is impossible: we didn't find a smaller part with the same max block.
2022.09.07 20:11:35.692011 [ 251 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): Part 20220722_128257_128274_4 found in queue and some source parts for it was lost. Will check all source parts.
2022.09.07 20:11:35.694238 [ 211 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): No replica has part covering 20220722_128257_128269_3 and a merge is impossible: we didn't find a smaller part with the same max block.
2022.09.07 20:11:35.696010 [ 185 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): No replica has part covering 20220725_122375_122386_1 and a merge is impossible: we didn't find a smaller part with the same max block.
2022.09.07 20:11:35.723678 [ 220 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): No replica has part covering 20220725_122375_123103_2 and a merge is impossible: we didn't find a smaller part with the same max block.
2022.09.07 20:11:35.723704 [ 220 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): Part 20220725_122375_123103_2 found in queue and some source parts for it was lost. Will check all source parts
Каким образом можно сообщить кликхаусу, что можно забыть об этих parts? Пытался дропнуть эти parts, но кх не находит их ни на одном сервере кластера.
Немного конфига: https://pastila.nl/?0122fc45/c0423fc284adac79bb7733eba420adae

Буду рад любой помощи или совету, спасибо.

14 ответов

47 просмотров

https://kb.altinity.com/altinity-kb-useful-queries/parts-consistency/#compare-the-list-of-parts-in-zookeeper-with-the-list-of-parts-on-disk https://kb.altinity.com/upgrade/removing-lost-parts/

Alex- Автор вопроса

Удалил parts в кипере, часть ошибок ушла, но всё также продолжает спамить ошибками вида: 2022.09.09 14:52:29.222514 [ 208 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): Part 20220819_209076_210927_24 found in queue and some source parts for it was lost. Will check all source parts. 2022.09.09 14:52:29.223450 [ 282 ] {} <Error> default.jaeger_index_local (ReplicatedMergeTreePartCheckThread): No replica has part covering 20220819_210910_210927_1 and a merge is impossible: we didn't find a smaller part with the same min block. Пытаюсь найти данные в system.zookeeper с таким названием, безуспешно, в system.parts тоже нет. Подскажите, пожалуйста, где ещё можно поискать эти parts?

Alex
Удалил parts в кипере, часть ошибок ушла, но всё т...

оно есть в system.mutations ? select * from system.mutations where not is_done ?

Alex
да, есть

kill mutation потом смотрите ошибки, если они прекратились, повторяем ALTER TABLE jaeger_index_local ON CLUSTER test_cluster_two_shards MODIFY TTL now() + toIntervalDay(14)

Alex- Автор вопроса
Denny [Altinity]
kill mutation потом смотрите ошибки, если они пре...

кластер перезагрузил, проверил что в system.mutations пусто, но ошибки не прекратились :( где ещё можно попробовать найти эти партсы?

Alex- Автор вопроса
Denny [Altinity]
что в system.replication_queue

https://pastila.nl/?025630eb/00b282d7a886cc2d16bac35eddfbd3da

Alex
https://pastila.nl/?025630eb/00b282d7a886cc2d16bac...

│ default │ jaeger_index_local │ 10.72.134.46 │ 3 │ queue-0024801056 │ GET_PART │ 2022-08-19 20:44:59 │ 0 │ │ 20220819_210910_210927_1 │ [] подключитесь к ZK и удалите queue-0024801056 из replica_path || '/queue/' и выполните system restart replica вот тут для справки смотрите https://github.com/ClickHouse/ClickHouse/issues/10368

Alex- Автор вопроса
Alex- Автор вопроса
Denny [Altinity]
│ default │ jaeger_index_local │ 10.72.134.46 │ ...

Удалил из кипера очереди, rmr /clickhouse/tables/c7d16c9c-e954-4d85-b660-24e4d23164cd/02/replicas/10.72.134.46/queue/queue-0024089225 но всё равно продолжает спамить теми же ошибками... в system.mutations пусто, кластер перезагружал, реплики перезагружал(system restart replicas) в replication_queue: https://pastila.nl/?025630eb/bfd8215047603087d7940c5c14221ef5 Уже и не знаю куда ещё можно смотреть

Alex
Удалил из кипера очереди, rmr /clickhouse/tables/...

я не понял сейчас >подключитесь к ZK и удалите queue-0024801056 из replica_path || '/queue/' и выполните system restart replica >>Удалил из кипера очереди, rmr /clickhouse/tables/c7d16c9c-e954-4d85-b660-24e4d23164cd/02/replicas/10.72.134.46/queue/queue-0024089225 в очереди queue-0024801056 --- т.е. я вам сказал удалить 0024801056 вы удалили 0024089225, 0024801056 остался, ну и в чем вопрос?

Alex- Автор вопроса
Denny [Altinity]
я не понял сейчас >подключитесь к ZK и удалите q...

очереди искал по статье, поэтому удалил другую. Сейчас выполнил ваши рекомендации и ошибка ушла. Спасибо огромное!

Похожие вопросы

Обсуждают сегодня

function LoadMemoryFromInet2( f:TMemoryStream; const url:string; var e:string ):Boolean; var http:TIdHttp; LHandler: TIdSSLIOHandlerSocketOpenSSL;begin Result := fals...
Александр Смоляков
1
Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
Я вот подумал. SSE выполняет операции максимум с 64-битной точностью. А FPU - всегда с 80-битной. Разве не должно быть FPU точнее тогда?
The Bird of Hermes
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
как быть с принтером? такой подход прокатит?
zamtmn
12
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
This is a big issue. Just by being a citizen of a country, you are denied to contribute to Open Source software: https://youtu.be/L5Ec5jrpLVk?si=1iIuHnMPbCB4anV-
Sharuzzaman Ahmat Raslan
72
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
Карта сайта