mission critical, support 27/7. У вас наверняка есть некая дежурная смена, которая решает аварийные ситуации. Как вы ведёте документацию с простейшими действиями восстановления доступности сервиса руками дежурных? Может есть какие-то удобные облачные дашборды?
Мы перешли на админки с кнопками "починить вот это", "починить то" и инсрукцией "если не чинится, то тогда звони". Норм получилось
имхо конфа бест
Rundeck
Обсуждают сегодня