приложением, которое крутится на этом сервере?
Ну, к пример, заканчивается дисковое пространство (об желательно заранее узнать) или не хватает ОЗУ .
что писать в логи и как хранить эти логи?
То есть как организовать работу так, чтобы не тратить кучу времени на выяснения причины и в идеале предотвращать их заранее
Для мониторинга нагуглил Prometheus + Grafana
Zabbix еще используют именно для оповещений об оперативке итд
В чате девопсов расскажут лучше, мне кажется :)
если не хочется ничего настраивать, есть https://cloud.google.com/monitoring/
Обсуждают сегодня