172 похожих чатов

За что вы так хейтите рук? У нас уже год

почти работает стабильно тьфу тьфу

35 ответов

10 просмотров

У многих кубер год работает, а потом тыква

George Gaál
У многих кубер год работает, а потом тыква

Постоянно боюсь что etcd развалится

Danya
Постоянно боюсь что etcd развалится

Я бы больше за бекапирование манифестов переживал чем за etcd

Aleksei 🇷🇺
почему не бэкапить просто etcd?

Чтоб потом кластер офигел ?

Aleksei-🇷🇺 Автор вопроса
George Gaál
Чтоб потом кластер офигел ?

что бы потом ты не офигел когда etcd в один момент has gone away

Danya
Постоянно боюсь что etcd развалится

- Я постоянно боюсь что etcd развалится, подскажите как с этим жить? - Сходите в церковь, свечку поставьте.

George Gaál
Точно! А ещё лучше - прими ислам

Не выйдет, Аллах-то давно в кубере ;)

George Gaál
Чтоб потом кластер офигел ?

Ладно, это вы ещё не видели как кубу сносит бошку когда у etcd случается сплит-брейн ;)

George Gaál
У етсд не бывает сплит брейн

бывает, если вдруг забыл --initial-cluster-state=new на existing переключить, человеческий фактор :)

George Gaál
Эм, это типикал мисконфигурейшен

в целом да, но если интересно, то расскажу. По всем канонам 12factor app, kube-apiserver totally stateless application, по этому когда это происходит не нужно даже дожидаться перезапуска kube-apiserver. Симптомы начнут себя проявлять мгновенно. Разберём две ситуации: Ситуация первая, когда у нас явный сплитбрейн. Когда все эндпоинты etcd работают в обычном режиме, но по какой-то причиен ничего не знают друг о друге. kube-apiserver настроен на общение со всеми из них. Первым делом вы обнаружите что каждый n'ый запрос возвращает no resources found, потому что kube-apiserver попадает в пустой etcd инстанс. Как показала практика куб продолжает работать в таком режиме и может существовать до того момента пока слегка прифигевший от происходящего админ не выпилит неисправную ноду из кластера. Ситуация вторая, когда у вас по каким-то причинам kube-apiserver начали ломиться в пустой etcd-кластер (бывало и такое), на самом деле это крайне неприятный факап, потому что все кубелеты обнаружат что их нодах не только ничего не запущенно, но и вообще ноды такой не существует и начнут один за другим прибивать ваш workload. При восстановлении бэкапа etcd, они конечно поднимут его снова, но даунтайм конечно будет нехилый.

𝚔𝚟𝚊𝚙𝚜
в целом да, но если интересно, то расскажу. По вс...

В пустой они не начнут ломиться, потому что сертификаты пира етсдклиента не подойдут

𝚔𝚟𝚊𝚙𝚜
Это если у тебя kubeadm)

А если нет? Если не можешь руками поднять - не поднимай

George Gaál
А если нет? Если не можешь руками поднять - не под...

у меня cert-manager выписывает сертификаты к etcd, так что в 99% случаев они всегда валидные

George Gaál
Т.е. ты это куб в кубе ловил?

Да, с тех пор юзаю --initial-cluster=existing для всего и вся

𝚔𝚟𝚊𝚙𝚜
в целом да, но если интересно, то расскажу. По вс...

Неее. С чего бы кублету убивать, если он получил ответ, что ноды такой нет в кластере ??? Вот если бы нода былааа, но в том етсд было написано, что на узле нету подов... тогда да, привел бы состояние к полученному. Ну и флапал бы туда сюда. Тут страшнее csi драйверы. Эти могут pv по удалять

Lucky SB
Неее. С чего бы кублету убивать, если он получил о...

На счёт кубелетов соглашусь это было бы логичным поведением, однако как показала практика последнего случая именно это и произошло. Не имею ни малейшего представления почему. Возможно кубелеты перезапустили свой реконсайлинг луп не удостоверившись что нода существует. Либо они получили утвердительный ответ с одного etcd и пустой список подов с другого или разные моменты времени.

Lucky SB
Неее. С чего бы кублету убивать, если он получил о...

На счёт CSI как раз бояться нечего, если нет ресурсов, то соответственно и в реконсайлинг луп csi-контроллера ничего не попадёт, удалять отсутствующие волумы он не будут. Проверял много раз.

George Gaál
там мог быть автоджойн нод...

Автоджойн тут не причем, кубелеты даже не рестортовали

Похожие вопросы

Обсуждают сегодня

подскажите пожалуйста, как мне освободить результат записанный в переменную result? в чем проблема подскажите если МОЖЕТЕ?
Михаил Helper
28
есть тут кто-то , кто только начал изучать си? если проходите курс на степике или как-то сами изучаете, пишите, может, скооперируемся?..
Eule
25
Скажите, тут нет проблемы? IMyInterface1 = interface function GetInterface2: IInterface2; ... function TMyInterface.GetInterface2: IInterface2; begin Result := TI...
Ruslan aka DUDE
18
Слушайте, ещё такая интересная задачка. Сделан аудит действий пользователей через триггеры в базе, соответственно каждый пользователь имеет свой логин и пароль в базе. Это пре...
Сергей Бычков
8
возможно для форматирования TimeStampZ нужен другой механизм, не?
Роман Лях (rgreat)
13
Добрый день. Абракадабра в 12-й студии ввела новый тип поля БД TSQLTimeStampOffset, использую в постгресе timestampz и вот с 12-й версии начались чудеса! До этого поля times...
Delphi Photo
9
Коллеги, здравствуйте! А можно узнать ваше мнение относительно Wolfram Mathematica vs Julia? Просто у меня стоит выбор между тем, чтобы продолжить преподавать Wolfram Mathemat...
Илья Гаража
10
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Утра доброго. Просветите пожалуйста. Хочу сделать rest сервер на делфи. Посмотрел 3 фреймворка: dmvc, Mars, mormot. Ни в одном из них не упоминается ассинхронная обработка вхо...
Сергей Бычков
6
Обновленный chat тестили уже господа? Готовимся на заводы ? Простой проект на ларавель собирает за 1 ответ..
Jacov Borisov
14
Карта сайта