184 похожих чатов

Добрый день. В Clickhouse скопилась очередь операций. В system.replication_queue 63

записи, операции типа TTL_DELETE. В колонке postpone_reason сказано следующее:


Not executing log entry queue-xxx for part xxx because 2 merges with TTL already executing, maximum 2.


Судя по всему, очередь скопилась из-за того, что TTL_DELETE мёрдж по одной из таблиц выполняется очень долго. Что можно сделать?

Есть возможность увеличить число параллельно выполняющихся ttl-операций? Что влияет на скорость ttl-операции? Должна ли помочь настройка ttl_only_drop_parts?

34 ответов

11 просмотров
Никита-Макушников Автор вопроса

Привет, ни у кого похожей ситуации не возникало?

Добрый день! Столкнулся с такой же проблемой, у вас получилось ее решить тогда?

Никита-Макушников Автор вопроса
Roman Ivanov
Добрый день! Столкнулся с такой же проблемой, у ва...

Очередь постепенно рассосалась, так и решили :) Можно подумать в сторону того, почему TTL_DELETE выполняется так долго. У нас это связано, скорее всего, с большим количеством условий TTL WHERE и кодеком сжатия ZSTD(3). Если мы сократим количество TTL условий или поменяем сжатие колонки, по которой выполняется TTL DELETE, на gzip, тогда TTL мердж должен будет выполняться быстрее и очередь не будет забиваться.

Никита Макушников
Очередь постепенно рассосалась, так и решили :) ...

у нас вообще не выполняется похоже и куда копать не понимаем причем только на одной реплике из 3х такая проблема

Никита Макушников
Ошибки в логах есть?

чего-то связанного с этим не нашел

Никита-Макушников Автор вопроса

Можно глянуть прогресс слияния, выполнив запрос: select * from system.merges m;

в общем там появляются мержи REGULAR а TTL_DELETE нет

Roman Ivanov
в общем там появляются мержи REGULAR а TTL_DELETE ...

Чем реплика отличается от других? Сколько у вас таблиц с ttl?

Denny [Altinity]
Чем реплика отличается от других? Сколько у вас т...

так вроде ничем ) по ресурсам одинаково, настройки одиаковые не могу точно ответить, в очереди видел только 2 можно как-то достоверно узнать это?

Roman Ivanov
так вроде ничем ) по ресурсам одинаково, настройк...

Посмотрите чему равно на других серверах max_number_of_merges_with_ttl_in_pool SELECT * FROM system.merge_tree_settings WHERE name like '%ttl%'

Roman Ivanov
везде 2

это новая реплика? С чего проблема началась?

Denny [Altinity]
это новая реплика? С чего проблема началась?

Нет все реплики одного возраста, мы просто начали получать Алерт с нее что диска мало, первоисточник проблемы не понятен

Denny [Altinity]
ну увеличьте этот парметр до 10 например.

я пытался уже, но почему-то кликхаус его не принимает, он в контексте merge_tree настраивается?

Roman Ivanov
это сложно ))

Тогда увеличьте прямо у таблицы хотя не факт что поможет

Roman Ivanov
это в SETTINGS? через alter?

Да в доке есть пример

Denny [Altinity]
Да в доке есть пример

он залочит таблицу? она почти 2ТБ наверное это тоже будет болезненно

спасибо, попробую

Roman Ivanov
спасибо, попробую

В system tables есть поле create_table что-то там , поищите в нем ilike "%ttl%' чтобы узнать сколько у вас таблиц с ttl

Roman Ivanov
а что даст ответ на этот вопрос?

Если там 1 то это одна проблема и надо разбираться с X, если там 18000 это другая проблема и надо крутить Y

Denny [Altinity]
Если там 1 то это одна проблема и надо разбираться...

Их не много, хорошо я попробую собрать статистику

Roman Ivanov
15 таблиц из них 5 системные *_log

На всех репликах одинаково? если их 15 то конечно 2 ttl одновременно может не хватать. Сделайте 10.

Denny [Altinity]
На всех репликах одинаково? если их 15 то конечно ...

одинаково попробуем, запланировали рестарт когда нагрузка низкая будет просто очередь вообще не двигается, сейчас висят задания со вчерашнего дня когда я таблицу пересоздал 2023-05-22 16:33:11, 20230508_106536_106536_1 и она как была первой в очереди так и остается

Roman Ivanov
одинаково попробуем, запланировали рестарт когда н...

остальные ttl параметры тоже такие? Ttl просыпается раз в 4 часа по дефолту, конечно на 15 ttl может не хватить 2х

Denny [Altinity]
остальные ttl параметры тоже такие? Ttl просыпаетс...

да, ноды полностью идентичны еслиб не хватало воркеров то их анверное не хватало бы на всех нодах

Denny [Altinity]
остальные ttl параметры тоже такие? Ttl просыпаетс...

в общем ап воркеров до 8 штук + рестарт помог спасибо!

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Привет, запускаю werf в dind в k8s, получаю ошибку на этапе build/beforeSetup: /.werf/stapel/embedded/bin/bash: /.werf/scripts/5898bdfe5214357d3706b879cc8d3d78460fb379607cbd...
florius0
7
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Добрый день, чат. Мне в очередь из других RabbitMQ по shovel валятся метрики в формате текста для Prometheus. Помогите пожалуйста подружить RabbitMQ и Prometheus, чтобы он (...
Aleksey
4
@ahndmn @ayaw0_0 здарова, на чем пишете?
Aiwan \ (•◡•) / _bot
7
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Карта сайта