172 похожих чатов

Господа, привет! Прошу помощи. У нас в кубе на 8

цпу начал лагать rabbitmq на 100к+ сообщений. А именно таймаутятся readines пробы - rabbitmq-diagnostics -q check_local_alarms через 20с. Я полез в графану (в том же кубе) и увидел, что прометеус стэк создал и всегда держит 200 процессов, а в пике около 400. Сам рэббит по ресурсам себя комфортно чувствует - цпу у него не растет выше 50%, память тоже

Не могу связать большое количество сообщений и замедление работы пода рэббита. Но предполагаю, что сервис с метрикой спавнит слишком много процессов и из-за этого на рэббит переключение исполнения происходит редко. Судя по тому, как лагает под рэббита, так и есть

Смотрю на вот эту метрику: container_processes{endpoint="https-metrics", id="/", instance="x", job="kubelet", metrics_path="/metrics/cadvisor", node="x", service="kube-prometheus-stack-kubelet"}

Ставим прометеус мы вот так https://pastebin.com/gzJLz1h4

Сталкивались ли с такой проблемой? Или, мб посоветуете какой-то проверенный способ с прометеусом в кубе?

4 ответов

18 просмотров

с одной стороны советуют кафка для высоких нагрузок. с другой стороны - почему вы связали прометей и реббит ???? каким образом они по вашему друг на друга влияют ? они на одно узле запущены ? на узле iowait Высокий ?

Anatoly- Автор вопроса
Lucky SB
с одной стороны советуют кафка для высоких нагрузо...

Да, пардон. Это одна нода в кубе. Все поды живут пока на одной ноде

Anatoly
Да, пардон. Это одна нода в кубе. Все поды живут п...

и реквесты с лимитами не заданы на подах ?

Anatoly- Автор вопроса
Lucky SB
и реквесты с лимитами не заданы на подах ?

Про кафку знаю, но вроде 100к не так много (хотя тоже вопрос), поэтому пока хочу попробовать докопаться до самой проблемы. Если проблема не в рэббите, то миграция на кафку просто затянет процесс На некоторых заданы, но не везде На рэббите есть реквест 2цпу 2гига. Загруз самой ноды тоже не выше 70% цпу и 50% рам Про iowait не знал, сейчас нагружу, посмотрю top-ом

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта