кубернетисами. есть кластер, довольно древний, на 1.23 версии
крутит много тысяч подов под собой. кластер используется для разработки и тестирования, и в нем очень много сущностей динамических. что-то деплоится, что-то удаляется постоянно. так вот проблема возникает при удалении. иногда, 1 раз из где-то 100 000 запусков подов при удалении пода он повисает в статусе "terminating". и не хочет удаляться, может висеть неделями. как с таким бороться?
Че по нагрузке на etcd ?
--grace-period=0 --force =))
менеджед, я ее не вижу
наверняка метрика в вебморде клауда есть
можно в саппорт написать
это да, но хочется может как-то без вот этого вот всего
да, поищу, спасибо
1.23 это еще свежак почти =) а че за менеджед?
не буду говорить) один из российских поставщиков
спасибо огрочное за идею, на самом деле. я уверен, что в этом проблема и есть. мы там мусор подгребаем по пятницам, одновременнио с помощью kube-janitor убивается много тысяч ресурсов. неудивительно, что у нас от этого немножко офигевает etcd. только на удаляемых джаниторов ресурсах воспроизводится, пазл сошелся
kube-janitor - заброшка же?
Не заброшена
а, пропустил ссылку на новое репо, спасибо
Нет, они реп перенесли просто
Обсуждают сегодня