184 похожих чатов

Коллеги, всем привет. Нужна помощь. Есть кластер из 1 шарда

с 2 нодами. 5 дней назад 1я нода стала отставать от 2й, сейчас разница примерно в 570млн строк. Данные во 2ю уже не вставляются, т.к. Code: 252. DB::Exception: Too many parts (2011). Merges are processing significantly slower than inserts. (TOO_MANY_PARTS) (version 22.6.3.35 (official build)). Куда рыть и что делать? Сервера железные, данные лежат на 5 рейде из 3 нвме карт.

16 ответов

26 просмотров

select * from system.replication_queue там есть поле exceptions

Игельшнойцхен- Автор вопроса
Denny [Altinity]
select * from system.replication_queue там есть п...

Роле пустое. В таблице боле 3млн записей. Есть поле postpone_reason там следующее - Not executing fetch of part 202305_16536780_16536780_0 because 8 fetches already executing, max 8.

выполните system restart replica ваша таблица затем сразу SELECT database, table, type, max(last_exception), max(postpone_reason), min(create_time), max(last_attempt_time), max(last_postpone_time), max(num_postponed) AS max_postponed, max(num_tries) AS max_tries, min(num_tries) AS min_tries, countIf(last_exception != '') AS count_err, countIf(num_postponed > 0) AS count_postponed, countIf(is_currently_executing) AS count_executing, count() AS count_all FROM system.replication_queue GROUP BY database, table, type ORDER BY count_all DESC

Игельшнойцхен- Автор вопроса
Denny [Altinity]
выполните system restart replica ваша таблица зат...

А как долго выполняется в среднем system restart replica?

Игельшнойцхен
А как долго выполняется в среднем system restart r...

от 0 секунд до часа в среднем видимо 30 минут

Игельшнойцхен- Автор вопроса
Denny [Altinity]
от 0 секунд до часа в среднем видимо 30 минут

Спасибо, в err лог пока сыпется с адской частотой вот это - 2023.05.10 19:11:32.935842 [ 36658 ] {175C55DF8287C4D0} <Warning> ClusterProxy::SelectStreamFactory: Local replica of shard 1 is stale (delay: 1683735092s.)

Игельшнойцхен- Автор вопроса
Denny [Altinity]
выполните system restart replica ваша таблица зат...

┌─database─┬─table──────────┬─type────────┬─max(last_exception)─┬─max(postpone_reason)────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┬────min(create_time)─┬─max(last_attempt_time)─┬─max(last_postpone_time)─┬─max_postponed─┬─max_tries─┬─min_tries─┬─count_err─┬─count_postponed─┬─count_executing─┬─count_all─┐ │ xxx │ yyy │ GET_PART │ │ Not executing log entry queue-0070763642 for part 202305_17587216_17587216_0 because it is covered by part 202305_17587197_17587216_2 that is currently executing. │ 2023-05-05 20:12:17 │ 2023-05-10 19:16:54 │ 2023-05-10 19:16:54 │ 149 │ 1 │ 0 │ 0 │ 935095 │ 1 │ 2932804 │ │ xxx │ yyy │ MERGE_PARTS │ │ Not executing log entry queue-0070762391 of type MERGE_PARTS for part 202209_36619_36632_2 because part 202209_36619_36626_1 is not ready yet (log entry for that part is being processed). │ 2023-05-06 06:31:07 │ 1970-01-01 03:00:00 │ 2023-05-10 19:16:54 │ 2 │ 0 │ 0 │ 0 │ 1 │ 0 │ 183285 │ └──────────┴────────────────┴─────────────┴─────────────────────┴─────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┴─────────────────────┴────────────────────────┴─────────────────────────┴───────────────┴───────────┴───────────┴───────────┴─────────────────┴─────────────────┴───────────┘

Игельшнойцхен
┌─database─┬─table──────────┬─type────────┬─max(la...

вот такой запрос что возращает select count() from ( select zoo.p_path as part_zoo, zoo.ctime, zoo.mtime, disk.p_path as part_disk from ( select concat(path,'/',name) as p_path, ctime, mtime from system.zookeeper where path in (select concat(replica_path,'/parts') from system.replicas) ) zoo left join ( select concat(replica_path,'/parts/',name) as p_path from system.parts inner join system.replicas using (database, table) ) disk on zoo.p_path = disk.p_path where part_disk='' and zoo.mtime <= now() - interval 1 day )

Игельшнойцхен
0 строк

count = 0 ? или 0 строк?

Игельшнойцхен- Автор вопроса
Denny [Altinity]
count = 0 ? или 0 строк?

┌─count()─┐ │ 0 │ └─────────┘

Игельшнойцхен
┌─count()─┐ │ 0 │ └─────────┘

выложите на pastila.nl select * from system.replication_queue where is_currently_executing и select * from system.merges

Игельшнойцхен- Автор вопроса
Denny [Altinity]
выложите на pastila.nl select * from system.repli...

Оба запроса вернули по 0 строк

Игельшнойцхен
Оба запроса вернули по 0 строк

а что с system restart replica ваша таблица ? все еще не закончился? я бы рестартовал КХ, если не будет останавливаться, то kill -9

Игельшнойцхен- Автор вопроса
Игельшнойцхен
┌─database─┬─table──────────┬─type────────┬─max(la...

Уже отработал. Вы попросили сразу после выполнения приложить вывод запроса... Я рпиложил

Игельшнойцхен- Автор вопроса

Похожие вопросы

Обсуждают сегодня

а через ESC-код ?
Alexey Kulakov
29
30500 за редактор? )
Владимир
47
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
13
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
Ребят в СИ можно реализовать ООП?
Николай
33
program test; {$mode delphi} procedure proc(v: int32); overload; begin end; procedure proc(v: int64); overload; begin end; var x: uint64; begin proc(x); end. Уж не знаю...
notme
6
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта