184 похожих чатов

Добрый день. В Clickhouse скопилась очередь операций. В system.replication_queue 63

записи, операции типа TTL_DELETE. В колонке postpone_reason сказано следующее:


Not executing log entry queue-xxx for part xxx because 2 merges with TTL already executing, maximum 2.


Судя по всему, очередь скопилась из-за того, что TTL_DELETE мёрдж по одной из таблиц выполняется очень долго. Что можно сделать?

Есть возможность увеличить число параллельно выполняющихся ttl-операций? Что влияет на скорость ttl-операции? Должна ли помочь настройка ttl_only_drop_parts?

34 ответов

25 просмотров
Никита-Макушников Автор вопроса

Привет, ни у кого похожей ситуации не возникало?

Добрый день! Столкнулся с такой же проблемой, у вас получилось ее решить тогда?

Никита-Макушников Автор вопроса
Roman Ivanov
Добрый день! Столкнулся с такой же проблемой, у ва...

Очередь постепенно рассосалась, так и решили :) Можно подумать в сторону того, почему TTL_DELETE выполняется так долго. У нас это связано, скорее всего, с большим количеством условий TTL WHERE и кодеком сжатия ZSTD(3). Если мы сократим количество TTL условий или поменяем сжатие колонки, по которой выполняется TTL DELETE, на gzip, тогда TTL мердж должен будет выполняться быстрее и очередь не будет забиваться.

Никита Макушников
Очередь постепенно рассосалась, так и решили :) ...

у нас вообще не выполняется похоже и куда копать не понимаем причем только на одной реплике из 3х такая проблема

Никита Макушников
Ошибки в логах есть?

чего-то связанного с этим не нашел

Никита-Макушников Автор вопроса

Можно глянуть прогресс слияния, выполнив запрос: select * from system.merges m;

в общем там появляются мержи REGULAR а TTL_DELETE нет

Roman Ivanov
в общем там появляются мержи REGULAR а TTL_DELETE ...

Чем реплика отличается от других? Сколько у вас таблиц с ttl?

Denny [Altinity]
Чем реплика отличается от других? Сколько у вас т...

так вроде ничем ) по ресурсам одинаково, настройки одиаковые не могу точно ответить, в очереди видел только 2 можно как-то достоверно узнать это?

Roman Ivanov
так вроде ничем ) по ресурсам одинаково, настройк...

Посмотрите чему равно на других серверах max_number_of_merges_with_ttl_in_pool SELECT * FROM system.merge_tree_settings WHERE name like '%ttl%'

Roman Ivanov
везде 2

это новая реплика? С чего проблема началась?

Denny [Altinity]
это новая реплика? С чего проблема началась?

Нет все реплики одного возраста, мы просто начали получать Алерт с нее что диска мало, первоисточник проблемы не понятен

Denny [Altinity]
ну увеличьте этот парметр до 10 например.

я пытался уже, но почему-то кликхаус его не принимает, он в контексте merge_tree настраивается?

Roman Ivanov
это сложно ))

Тогда увеличьте прямо у таблицы хотя не факт что поможет

Roman Ivanov
это в SETTINGS? через alter?

Да в доке есть пример

Denny [Altinity]
Да в доке есть пример

он залочит таблицу? она почти 2ТБ наверное это тоже будет болезненно

спасибо, попробую

Roman Ivanov
спасибо, попробую

В system tables есть поле create_table что-то там , поищите в нем ilike "%ttl%' чтобы узнать сколько у вас таблиц с ttl

Roman Ivanov
а что даст ответ на этот вопрос?

Если там 1 то это одна проблема и надо разбираться с X, если там 18000 это другая проблема и надо крутить Y

Denny [Altinity]
Если там 1 то это одна проблема и надо разбираться...

Их не много, хорошо я попробую собрать статистику

Roman Ivanov
15 таблиц из них 5 системные *_log

На всех репликах одинаково? если их 15 то конечно 2 ttl одновременно может не хватать. Сделайте 10.

Denny [Altinity]
На всех репликах одинаково? если их 15 то конечно ...

одинаково попробуем, запланировали рестарт когда нагрузка низкая будет просто очередь вообще не двигается, сейчас висят задания со вчерашнего дня когда я таблицу пересоздал 2023-05-22 16:33:11, 20230508_106536_106536_1 и она как была первой в очереди так и остается

Roman Ivanov
одинаково попробуем, запланировали рестарт когда н...

остальные ttl параметры тоже такие? Ttl просыпается раз в 4 часа по дефолту, конечно на 15 ttl может не хватить 2х

Denny [Altinity]
остальные ttl параметры тоже такие? Ttl просыпаетс...

да, ноды полностью идентичны еслиб не хватало воркеров то их анверное не хватало бы на всех нодах

Denny [Altinity]
остальные ttl параметры тоже такие? Ttl просыпаетс...

в общем ап воркеров до 8 штук + рестарт помог спасибо!

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта