184 похожих чатов

Сломалась репликации на одном из хостов КХ в replication_queue растет количество

записей с postpone_reason

Not executing fetch of part 20220414_241_241_0 because 16 fetches already executing, max 16

На другой реплике эти парты есть, и они не пустые. Что это может быть и что делать?
КХ 22.3.3.44

16 ответов

35 просмотров

ну у вас уже 16 фетчей запущено подождите. должно рассосаться, если не рассасывается то что-то не так делаете со вставкой сколько партов новых в секунду у вас создается по part log? что именно сломалось в репликации? Реплика в оффлайн выпадала и до ZK не могла достучаться?

Andrei-K Автор вопроса
Slach [altinity]
ну у вас уже 16 фетчей запущено подождите. должно ...

два часа копилось, но как только Вы написали, и стало рассасываться) Новых партов мало, реже чем 1 в 10 секунд

Andrei K
два часа копилось, но как только Вы написали, и ст...

тогда ждите когда прососется, все ок должно быть смотртите в system.replication_queue

Andrei-K Автор вопроса
Slach [altinity]
тогда ждите когда прососется, все ок должно быть с...

Вроде ок Правда есть другая проблема, что на нескольких шардах одна и та же таблица ушла в рид-онли на 2 из 3х реплик

Andrei K
Вроде ок Правда есть другая проблема, что на неско...

readonly это проблемы с zookeeper SELECT * FROM system.zookeper WHERE path='/' FORMAT Vertical проверьте если ок то смотрите в ошибки в SELECT * FROM system.replication_queue

Andrei-K Автор вопроса
Slach [altinity]
readonly это проблемы с zookeeper SELECT * FROM s...

в этом и проблема, что с зукипером связь есть а в replication_queue ошибок нет Только висит 20-50 штук старых GET_PART (октябрьских оО), но без ошибок

Andrei-K Автор вопроса
Andrei K
не помогает

а SYSTEM RESTART REPLICAS ?

Andrei-K Автор вопроса
Slach [altinity]
а SYSTEM RESTART REPLICAS ?

Тоже не помогло Если бы были проблемы с зукипером, то все таблицы бы ушли в read-only, верно? У меня же ушла ровно одна таблица..

Andrei K
Тоже не помогло Если бы были проблемы с зукипером,...

Ну вы говорите что таблица в readonly посмотрите все такие system.replication_queue в last_postpone_reason судя по всему таблица readonly потому что она пытается скачать парты которые уже не существуют и почему то не качает парты более поздние которые эти старые парты покрывают то есть таблица по каким то причинам долго парты не скачивала думаю имеет смысл на той реплике где таблица не read-only запустить SYSTEM RESTORE REPLICA db.table чтобы раскатить актуальное состояние на остальные реплики

Andrei-K Автор вопроса
Slach [altinity]
Ну вы говорите что таблица в readonly посмотрите...

Да, таблица в readonly Но в system.replication_queue ошибок нет, last_postpone_reason везде пустое restore не запускается на реплике, где не рид-онли, потому что Code: 36. DB::Exception: Received from localhost:9000. DB::Exception: Replica must be readonly. (BAD_ARGUMENTS) system restart replica тоже не помогает со здоровой реплики..

Andrei K
Да, таблица в readonly Но в system.replication_que...

со здоровой реплики restart бесполезно делать ок. что в system.replicas на репликах которые readonly ? SELECT * FROM system.replicas WHERE ... FORMAT Vertical ?

Andrei-K Автор вопроса
Slach [altinity]
со здоровой реплики restart бесполезно делать ок....

SELECT * FROM system.replicas WHERE is_readonly FORMAT Vertical там есть last_queue_update_exception: Code: 49. DB::Exception: Part 20211028_19882_19888_1 intersects next part 20211028_19886_19890_1. It is a bug or a result of manual intervention in the ZooKeeper data. (LOGICAL_ERROR) (version 22.3.3.44 (official build))

Andrei K
SELECT * FROM system.replicas WHERE is_readonly FO...

знаете как переводится manual intervention in the zookeeper data? ничего через zkCli.sh не чистили?

Andrei-K Автор вопроса
Slach [altinity]
знаете как переводится manual intervention in the ...

Если дропнуть таблицу на реплике и создать заново, он вроде нормально начинает работать Только так не хочется делать, потому что это очень геморно (просто дропнуть и создать таблицу я не могу, приходится с перезапуском сервера это делать), да и таблица очень большая, долго догоняется

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
Ребят в СИ можно реализовать ООП?
Николай
33
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта