костыльный, мы экспортеры не используем, а собираем метрики телеграфом, пушим в другой телеграф и его уже скрапим прометеусом. Т.е. джоба у нас только одна - телеграф на локалхосте. И если хост упал - метрика просто пропадает и up==0 бесполезен.
Что up==0 не поможет при автодисковери я например тут подсмотрел
https://serverfault.com/questions/938223/prometheus-alert-rule-for-absent-discovered-target
Если под в кубике пропадает, как алертить что он пропал?
>It seems I need an alert: absent(up{job="kubernetes-pods", app="foo"}) and another one absent(up{job="kubernetes-pods", app="bar"}) and so on and so forth for each pod/service/node. Because the single alert absent(up{job="kubernetes-pods"}) has none of the labels such as "app" or "instance" or "namespace" to report in the alert text.
У меня костыль с up == 0 or absent, что бы хотя бы понимать, что что-то пропало) По идее, можно накостылить с for: 1h, что бы сохранялись метки
Обсуждают сегодня