проде?
Я вот дошел до использования simhash/lsh, чтобы не бомбить поддержку сотнями похожих сообщений в день через Splunk со всех серверов.
наверное базовые соображения такие: 1) снижать уровень алертов до того, на котором они все закрываются или хотя бы на них реагируют. Если они не все закрываются, то это как красные тесты, в них нулевая ценность 2) сопоставлять алерты с продуктовой метрикой. Если что-то отваливается, но не приводит к потере денег, то следить надо только за тем, что приводит к потере денег
Обсуждают сегодня