него больше не приходят
- jobа через автодискавери, соответственно node_exporter хоста пропадает с сервис дикавери и метрика up пропадает (== алерт когда`up == 0` не работает)
Для примера буду использовать метрику system_uptime:
- absent(system_uptime) не подходит, так как не возвращает лейблы
- absent(system_uptime{host="hostname"}) не подходит, так как хардкод
- count by(host) (system_uptime offset 6h) unless count by(host) (system_uptime) - не очень подходит (спустя шесть часов шесть часов назад метрики тоже не было - значит все ок и алерт резолвится)
Вроде бы очень стандартная фича - алертить по no data. Как вы живете с этим? Неужели для ноудат придется еще забикс отдельно поднимать 😂😂
погоди с чего вдруг оно из service discovery должно пропасть? service discovery использует apiserver если хост упал "внезапно" то в k8s apiserver node останется, статус может только поменяется и у тебя up{...} == 0 должен сработать он для этого и придуман вроде бы чтобы быть уверенными что exporters живые
а если речь не о кубике, а о консуле, например?
Обсуждают сегодня