метрики. Чтобы соответствовать тематике канала, спрошу про SLA, так как это около метриковая штука:
Интересно как вы высчитывает коэффициент доступности кластетера постгри. Так как мультимастер не выдерживает высокий rps, то чаще всего юзают primary-standby, но раз уж мы тут про мультимастер завели речь, то вот второй вопрос:
Если один из мультимастеров отъехал, но при этом кластер сам жив, на запросы отвечает, и даже успевает в указанные в sla временные лимиты, не уверен что у вас до такого дошло, но тем не менее. Так вот все работает, но один из серверов сдох, как это отразится на вашем коэффициенте? Вы его прям на лету считаете и по нему алертите?
лично мне по большому счету все равно - я предоставляю IaaS и базы у нас не постгресс, если что сдохнет сервер с базой - переключатся на один из резервных, деградировав до 1+1 отказоустойчивости при чем традиционно бизнес совершенно не волнует, что такие довтаймы укладываются в ранее согласованный SLA - все всегда хотят availability строго 100%, пока дело до денег не доходит
Обсуждают сегодня