"kube-etcd": 100% of requests for Watch failed on etcd instance
В логах идет постоянный перевыбор лидера у etcd, а на одной из нод у кубелета в логах такое:
panic: runtime error: invalid memory address or nil pointer dereference
При это статус etcd кластера ок, RAFT INDEX увеличивается. Что это может быть?
все ли норм с сетью между etcd нодами?
такая проблема только изза сети может быть?
ну если у вас постоянные перевыборы лидера, то видимо лидер не сообщает о своем лидерстве периодически, то есть heartbeat пакетики не доледают до ведомых
ну этьо физическая сеть а не плагин cni ?
у вас etcd ноды по какой сети общаются между собой?
эндпоинты на внутренних интерфейсах нод
Проблемную ноду пробовал выключать ? Етсд переставал выборы устраивать ?
проблема на кубелете на ноде только сегодня была. а сами ошибки 2 дня назад появились
Ну тогда могу предложить попрыгать. Если не хочешь хотя бы etcd стопнуть
перезагрузка ноды не помогла. опять происходят выборы лидера
Обсуждают сегодня