171 похожих чатов

Всем привет! Нам на проекте необходим мониторинг сети (кол-во полученных

байт, кол-во переданных байт) в реальном времени (с точностью до 1 секунды). Сейчас это делается с помощью node exporter + prometheus, который скрапит соответствующие метрики раз в секунду. После чего это визуализируется в графане с помощью выражения: sum(irate(node_network_receive_bytes_total{job="$job", instance=~"$node"}[1m])) by (device) * 8. Последнее время закрадывается подозрение, что такой подход не всегда отображает внезапные скачки использования сетевого трафика (ради этого все и вводилось). Мб есть какие-нибудь другие инструменты для того, чтобы получить адекватный график загруженности сети?

4 ответов

20 просмотров

Ну пусть не закрадывается. Что мешает проверить? Где именно по этой гипотезе тормозятся данные?

а на дешборде в графане какой min_interval стоит при этом?

Konstantin-Bobkov Автор вопроса
Pavel Zheltouhov
Ну пусть не закрадывается. Что мешает проверить? Г...

Честно говоря не совсем ясно как проверить. Было бы альтернативное решение, то задеплоил бы его на стейджинге, прогнал бы нагрузочные и сравнил оба подхода. Про торможение данных не совсем понял. Ну если смотреть в prometheus и на его last scrape, то там бывают значения больше одной секунды. Учитывая, что у нас на каждом стенде прометеус стоит, который раз в секунду скрапит метрику с каждой ноды стенда, после чего метрика с этого прометеуса скрапится глобальным прометеусом, из которого она уже в графану попадает, то, конечно, возможны задержки. У меня скорее вопрос про сам подход: высчитывать подобный график с помощью irate.

Сомнения правильные. Почитайте https://valyala.medium.com/why-irate-from-prometheus-doesnt-capture-spikes-45f9896d7832 . Там описано, почему irate - не лучшее средство для обнаружения всплесков на графиках, и приведнны альтернативные способы, как можно надежно отображать всплески на графиках пр любом интервале времени

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта