Коллеги, помогите плиз. Вместе с prometheus-operator в кубик заехали некие дефолтные

Question

Коллеги, помогите плиз. Вместе с prometheus-operator в кубик заехали некие дефолтные

правила, одно из которых такое:

alert: KubeNodeUnreachable
expr: (kube_node_spec_taint{effect="NoSchedule",job="kube-state-metrics",key="node.kubernetes.io/unreachable"}
unless ignoring(key, value) kube_node_spec_taint{job="kube-state-metrics",key=~"ToBeDeletedByClusterAutoscaler|cloud.google.com/impending-node-termination|aws-node-termination-handler/spot-itn"})
== 1

Оно триггерится, когда какая то нода 15 минут и более недоступна. У меня есть несколько preemptible нод, которые иногда долго переподнимаются, от чего триггерится этот алерт.Никак не получается пофиксить это правило. Пытаюсь скрестить с kube_node_labels{label_yandex_cloud_preemptible="true"}

Может кто-то уже решал подобный кейс?

#metrics #programming #russian

0

12.10.2020

4 ответов

32 просмотра

Антон Сенько Автор вопроса

угу, немного неточно выразился. так и есть - с чартом

0

12.10.2020

Slach [altinity]

дык покопайте чарт может там можно поправить эти рулесы ну или чарт форкните если нельзя

0

12.10.2020

Антон Сенько Автор вопроса

да рулесы-то я знаю как поправить, я выражение не могу пофиксать (

0

12.10.2020

Slach [altinity] · Accepted Answer

Slach [altinity]

вообще с prometheus-operator никаких "дефолтных рулесов" не идет потому что rules туда ставятся через CRD отдельный вот с helm chart который ставит prometheus-operator вполне возможно такие CRD прилетают

0

12.10.2020

171 похожих чатов

Коллеги, помогите плиз. Вместе с prometheus-operator в кубик заехали некие дефолтные

4 ответов

Похожие вопросы