обрабатываете ситуации когда сервис теряет коннект с другим хостом или базой? Держать на каждом хосте blackbox_exporter и с него собирать инфу о доступности?
Я бы научил приложение, что бы оно само слало метрики, в частности бля я проебало дб
Обсуждают сегодня