184 похожих чатов

Кликхаус clickhouse/clickhouse-server:23.10.1 в кубере. Когда резко в моменте растет нагрузка

(например, в 40 клиентов какие-то запросы кидаются), кликхаус начинает есть ~0 CPU и все запросы просто зависают и потом отваливаются по таймауту, клиентом тоже не подключиться. При этом вроде как процесс не стопается (иначе бы перезагрузился под). Спасает только ручная перезагрузка. Подскажите, пожалуйста, куда можно посмотреть, какие настройки поменять?

В логах вроде как ничего сверхъестественного нет. На скрине пример просадки CPU, после ребута все возвращается в норму.

20 ответов

77 просмотров

вообще такое в гитхаб надо спрашивать но https://kb.altinity.com/altinity-kb-useful-queries/debug-hang/

limits / requests на pod стоят по CPU? если в limits упираетесь, тогда будет тротлинг

Andrey Tvorozhkov
Нет, не стоят

как clickhouse в кубах развернут? через clickhouse-operator ? или какой то кастомный helm chart а-ля bitnami?

Andrey-Tvorozhkov Автор вопроса
Slach [altinity]
как clickhouse в кубах развернут? через clickhouse...

Через helm чарт, но не уверен чей. Стейтфул сет выглядит вот так: https://gist.github.com/tvorogme/042954f5ecb7e24c930e40667aefc58f

поставьте 90%

Andrey-Tvorozhkov Автор вопроса
Andrey Tvorozhkov
А так падает

логи контейнера есть? что падает с каким сообщением? или просто pod в Pending переходит?

Andrey-Tvorozhkov Автор вопроса
Slach [altinity]
логи контейнера есть? что падает с каким сообщени...

Логи могу сдампить, сек. Нет, под Running, но никак не подключиться к кх. Даже если захожу в контейнер и использую clickhouse-client. Падает с timeout

а wget http://127.0.0.1:8123/ping внутри контейнера с clickhouse что показывает?

Andrey-Tvorozhkov Автор вопроса

Вот это спасает, т.е. действительно после запуска нагрузки оно отрабатывает и не скатывается в это странное состояние (вроде как, я заметил это совсем недавно)

Andrey Tvorozhkov
Вот это спасает, т.е. действительно после запуска ...

for i in $(ls -1 /proc/$(pidof clickhouse-server)/task/); do kill -TSTP $i; done

Andrey-Tvorozhkov Автор вопроса
Denny [Altinity]
for i in $(ls -1 /proc/$(pidof clickhouse-server)/...

Не помогает ^Croot@clickhouse-0:/# for i in $(ls -1 /proc/$(pidof clickhouse-server)/task/); do kill -TSTP $i; done root@clickhouse-0:/# clickhouse-client -u ... --password "...." ClickHouse client version 23.10.1.1976 (official build). Connecting to localhost:9000 as user mega. Connected to ClickHouse server version 23.10.1 revision 54466.

а сервер один? или воспроизводится? я бы проверил что в 23.8.5

Andrey-Tvorozhkov Автор вопроса
Denny [Altinity]
а сервер один? или воспроизводится? я бы проверил ...

Сервер один, я как раз обновил КХ до 23.10, чтобы проверить, с 23.8 там было так же

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта