Кто-Нибудь делал один кластер на много команд. Эдакий soft multi

Question

Кто-Нибудь делал один кластер на много команд. Эдакий soft multi

tenancy? Как вы боретесь, с тем что девы выставляют нереалистично низкие resources requests , забивают ноду подами и она под их весом схлопывается, особенно если не сразу, а когда нибудь ночью. Очевидный способ выделить свои ноды для каждой команды. Ещё какие-нибудь можно?

#devops #kubernetes #programming #russian

0

28.09.2021

33 ответов

57 просмотров

Roman Trawin

resourceQuota настроить

0

28.09.2021

kis

Dmitriy Ivanov
https://kubernetes.io/docs/tasks/administer-cluste...

тогда реально так

0

28.09.2021

Mike Wazowski Автор вопроса

kis
тогда реально так

Как так? Там ограничения на реквесты и лимиты, как это поможет томку, что команды ставят реквесты 100m и 100MiB , а сжирают 4 и 4GiB

0

28.09.2021

Vasily Bortnikov

Тоже такой бедой страдаю в данный момент. Ранчер, надо нарезать каждой команде кластер, да и нехай там делают что хотят.

0

28.09.2021

Mike Wazowski Автор вопроса

Vasily Bortnikov
Тоже такой бедой страдаю в данный момент. Ранчер, ...

Да тут на проект новый позвали. Было 60 кластеров, решили их как то аудитить, быстро задолбались, решили сделать мега кластер на всех. По мне так надо было сделать автоматическую нарезалку стандартных кластеров, но видимо решили что экспертизы не хватит и сделать один любимый кластер проще

0

28.09.2021

Vasily Bortnikov

Mike Wazowski
Да тут на проект новый позвали. Было 60 кластеров,...

Сранчером кластера нарезаются легко. У меня вот тоже бардак с ресурсами, дев же, все нестабильно. Каждое утро вижу оом кильнутую ноду, кубклет мертв, перегружаю вручную

0

28.09.2021

Dmitry Sergeev 🇺🇦

limitrange настрой, там можно выставить минимальные значения для реквестов/лимитов. Куб им не даст выставить меньше. А также там дефолты можно настроить и максимально возможные значения

0

28.09.2021

Pavel Litvyak

А вариант принудительно через LimitRange выставлять какие-то более адекватные дефолтные реквесты не рассматривается?

0

28.09.2021

Dmitry Sergeev 🇺🇦

Mike Wazowski
Как так? Там ограничения на реквесты и лимиты, как...

limitrange также может выставлять дефолтные лимиты. Они просто физически из-за лимитов не смогут сожрать 4 ядра и 4GiB

0

28.09.2021

Mike Wazowski Автор вопроса

Dmitry Sergeev 🇺🇦
limitrange настрой, там можно выставить минимальны...

Это не поможет. Ведь реально много настоящих микроподов

0

28.09.2021

Stefan

Mike Wazowski
Это не поможет. Ведь реально много настоящих микро...

ну тогда cluster-autoscaler в помощь но ругать их придется всё равно

0

28.09.2021

Dmitry Sergeev 🇺🇦

Mike Wazowski
Это не поможет. Ведь реально много настоящих микро...

ну проставь дефолты в 50m/50Mi как по реквестам так и по лимитам. Если они не проставят лимиты, то автоматом выставяться 50m/50Mi. Вот тебе и микропод у которого в реквестах 50m/50Mi и в лимитах тоже самое. Будет реально настоящий микропод

0

28.09.2021

Mike Wazowski Автор вопроса

Stefan
ну тогда cluster-autoscaler в помощь но ругать их ...

autoscaler же по реквестам работает, а по ним все влезает всюду

0

28.09.2021

Grigoriy Rochev

Mike Wazowski
autoscaler же по реквестам работает, а по ним все ...

Лимиты и реквесты выставляешь одинаковыми, пишешь адмишен хук, который проверяет это

0

28.09.2021

Stefan

Mike Wazowski
autoscaler же по реквестам работает, а по ним все ...

ну если у тебя aws vpc cni то там лимит на поды в рамках ноды под будет в пендинг статусе если не влезит а автоскейлер запровиженит тебе ноду

0

28.09.2021

Mike Wazowski Автор вопроса

Dmitry Sergeev 🇺🇦
ну проставь дефолты в 50m/50Mi как по реквестам та...

Команда затем деплоит ява монстра без реквестом, ему проставляется минимальный реквест, он влезает на ноду и устраивает там дестрой.

0

28.09.2021

Dmitry Sergeev 🇺🇦

Mike Wazowski
Команда затем деплоит ява монстра без реквестом, е...

нет, будет так: команда деплоит ява монстра без реквестов. лимитрендж ставит ему реквесты и лимиты 50m/50Mi. И этот ява монтср ничего не сжирает и падает на этапе инициализации по OOM. Команда задумывается, и ставит правильные реквесты и лимиты

0

28.09.2021

Mike Wazowski Автор вопроса

Dmitry Sergeev 🇺🇦
нет, будет так: команда деплоит ява монстра без ре...

они бампят лимиты, но не реквесты, потому что CI тогда всегда зелёный и копипастят это из проекта в проект

0

28.09.2021

Dmitry Sergeev 🇺🇦

Mike Wazowski
они бампят лимиты, но не реквесты, потому что CI т...

в лимитренж есть maxRatio (насколько лимиты могут превосходить реквесты). И они ничего не смогут бампить, им придется ставить нормальный лимит

0

28.09.2021

Михаил Инетовский

Не знаю как в условиях нескольких команд, но у нас тоже недавно была проблема, что при рестарте кучи микросервисов и их скейлинге, падали ноды вместе с бд и прочими вещами. Решили с помощью НодАфинити, введя рассовую сегрегацию с белыми и чёрными нодами.

0

28.09.2021

Mike Wazowski Автор вопроса

Dmitry Sergeev 🇺🇦
в лимитренж есть maxRatio (насколько лимиты могут ...

о , годно

0

28.09.2021

Dmitry Sergeev 🇺🇦

Mike Wazowski
о , годно

maxLimitRequestRatio

0

28.09.2021

George Gaál

Михаил Инетовский
Не знаю как в условиях нескольких команд, но у нас...

Тоже норм

0

28.09.2021

Pavel Litvyak

Кстати, а как именно схлопывается нода? Прожорливые поды с задранными лимитами потребляют весь CPU и нода уходит в NotReady?

0

28.09.2021

Ilyas Arinov

психологические проблемы техническими средствами не решаются

0

28.09.2021

Ilyas Arinov

Pavel Litvyak
Кстати, а как именно схлопывается нода? Прожорливы...

я видел только как прожорливые поды просто выселяются с ноды

0

28.09.2021

Михаил Инетовский

Ilyas Arinov
я видел только как прожорливые поды просто выселяю...

Наблюдал на проде как бд с редисом выселились 👍

0

28.09.2021

Vasily Bortnikov

Pavel Litvyak
Кстати, а как именно схлопывается нода? Прожорливы...

пока не пойму как. Приходит оомкиллер. Обычно, он мочит fluentd от банзая Ладно, там все тормозит, кубелет не отдупляет. Но когда киллер полечил, почему нода не оживает - не пойму.

0

28.09.2021

Serhii Sergey

Vasily Bortnikov
пока не пойму как. Приходит оомкиллер. Обычно, он...

Ооооо, прям наш случай) Только флюентд у нас стоковый. А так один в один

0

28.09.2021

Vasily Bortnikov

Serhii Sergey
Ооооо, прям наш случай) Только флюентд у нас стоко...

Более того, один из подов вроде как guaranteed должен быть. Что-то я недогоняю в кубере.

0

28.09.2021