что одна нода вольта именно засилена в не упала? Он же метрики не отдаёт когда она засилена.
А упала и запечатана не одно и тоже? Она же не работает по сути
Event пробки снимай из k8s. Там обычно написано sealed
отсутствие отдачи метрик - это тоже своего рода метрика. в метрике up нода пропадёт
Это понятно. Сделать алерт что один под вольта упал проблем не вызывает. Вопрос в том что нужно именно отследить состояние что под засилен чтобы сделать соответствующий алерт в промитеусе что именно надо идти и делать ансил, а не что-то другое.
Добавь к алерту на падение пода вольта инфу, что надо сделать ансил.
Ну вот допустим есть у меня в вольте какой-нибуть планиг который при обновлении не завёлся или что-то с базой и под не взлетел. Это-же не реально будет отличить от засиленого вольта. С точки зрения мониторинга это одно и то-же состояние будет.
Эвент... ты путаешь компоненты: Alertmanager и Prometheus
Когда пойдешь делать ансил, ты увидишь, что проблема в другом, и решишь ее. Смысл же не замониторить каждый отдельный кейс, а среагировать.
метрика vault_core_unsealed не поможет?
Обсуждают сегодня