как я понял, происходит переселение POD’ов и часть из них селится обратно на эту же ноду. По итогу когда нода ушла из кластера, несколько POD’ов может остаться в статусе Failed. Кто сталкивался? как бороться?
Всмысле селится обратно? Нода же тютю. Терминейшен хендлер надо по хорошему иметь
ну пока нода в процессе забора, выглядит так что часть POD’ов ассайнится на нее. И падает. По итогу, нода уходит, а POD остается в статусе Failed.
Терминейшен хендлер используйте
Не должно быть такого
спасибо. По быстрому гугланул. Вижу подобную штуку для aws. А оно как-то привязывается к облаку?
Да это у каждого обычно свое решение которое по факту подписано на эвенты и обрабатывает эвент забора спота
А есть еще варианты кроме termination handler’a? Дернул тут саппорт YC. Говорят пока такое не умеют. Здравствуйте. На данный момент нет. Если нода прерываемая, то ВМ отправляется сигнал на выключение. Через 60 секунд ВМ выключается со стороны гипервизора. Кластер должен будет отследить изменние в количестве подов в деплойменте и создать поды на оставшихся нодах.
Там ACPI event, который kubelet ловит. Никаких хитростей, встроено в kubelet.
Обсуждают сегодня