Прошу прощения, алерты в связке Prometheus - Alertmanager, нужно было сразу уточнить
Там вроде все просто. Падает инстанс - приходит алерт
Сейчас так и работает, просто думал что уже есть best practices или паттерны, не смог найти информации по построению гибкой системы (существует ли она вообще или все по наитию и индивидуально к каждой проблеме)
Nagios или Zabbix ?
Prometheus - Alertmanager - Grafana
Я привел пример "гибкой" системы
Обсуждают сегодня