184 похожих чатов

Подскажите пожалуйста, куда смотреть. Есть кластер 30 шардов, 2 реплики,

3 ноды зукипера.
Работает нормльно неделю или несколько дней, потом в один момент все ноды кликхауса упираются в лимит одновременных подключений (сначала 500, потом поднял до 1000 - аналогично). Подсоединиться к серверу кликхауса не получается ни на одной ноде. Рестарт машин - все оживает и работа кластера почти нормализована.
Почти - потому что огромное число таблиц вываливается в ридонли или реплики не онлайн, ругаясь на /clickhouse/tables/dbanme/tablepath/replicas/s0/log_pointer: node doesn't exist (No node). (KEEPER_EXCEPTION) (version 22.1.3.7 (official build))
Нагрузка весьма умеренная (обычно ЛА5 на 16 ядерном сервере не выше 5), вставок довольно много, но большими пачками или через буферные таблицы.
С сетью вроеде все хорошо, но ситуация повторялась уже с десяток раз и я в полном унынии и непонимании, куда смотреть и на что обращать внимание.
В логах зукипера (на лидере) поток сообщений следующего вида, даже когда кластер себя хорошо чувствует и все работает без проблем со стороны приложения
INFO [ProcessThread(sid:1 cport:-1)::PrepRequestProcessor@653] - Got user-level KeeperException when processing sessionid:0x2005a7265a80068 type:delete cxid:0x7487552 zxid:0x11572c0d7d txntype:-1 reqpath:n/a Error Path:/clickhouse/task_queue/ddl/query-00000516
На что обратить внимание, какие метрики могут пролить свет на ситуацию?

3 ответов

12 просмотров
vlad- Автор вопроса

Неужели никто не сталкивался с таким? я один счастливчик? :)

vlad
Неужели никто не сталкивался с таким? я один счаст...

Конфигурировали ЗК по рекомендации https://clickhouse.com/docs/en/operations/tips/#zookeeper ?

vlad- Автор вопроса
sdev E
Конфигурировали ЗК по рекомендации https://clickho...

Как бы да, но не совсем - версия 3.4.13, из репозитария, поэтому часть конфига из JVM не применимо вроде как

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Привет, запускаю werf в dind в k8s, получаю ошибку на этапе build/beforeSetup: /.werf/stapel/embedded/bin/bash: /.werf/scripts/5898bdfe5214357d3706b879cc8d3d78460fb379607cbd...
florius0
7
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Добрый день, чат. Мне в очередь из других RabbitMQ по shovel валятся метрики в формате текста для Prometheus. Помогите пожалуйста подружить RabbitMQ и Prometheus, чтобы он (...
Aleksey
4
Карта сайта