172 похожих чатов

Привет! Например, у меня есть кластер с 2 группами нод, 1

группа это легкие ноды с небольшим кол-вом ресурсов для запуска фронтенда, 2 группа – мощные машинки с кучей ядер для ML.

В идеале мне бы хотелось, чтобы количество мощных машинок сокращалось до 0 и не тратились деньги, когда они не используются, а если поступает запрос на ML, то новая мощная нода поднималась бы хотя бы секунд за 30.

Возможно ли это?

20 ответов

8 просмотров

Да

.sha- Автор вопроса
George Gaál
Да

читаю доку к cluster-autoscaler, но там есть упоминания “мы ожидаем, что новая нода будет поднята в течение 15 минут” – от чего зависит скорость поднятия новой ноды? Только от облачного провайдера, на котором мой кластер запущен?

.sha
читаю доку к cluster-autoscaler, но там есть упоми...

В том числе, но если у тебя Амазон - я бы рекомендовал karpenter

.sha- Автор вопроса
George Gaál
В том числе, но если у тебя Амазон - я бы рекоменд...

А почему карпентер? Мы юзаем обычный автоскейлер и он с амазоном работает норм, но думаем переходить потому что карпентер поддерживает podSpreadConstraints. Почему именно для амазона рекомендуешь?

Kirill Garbar
А почему карпентер? Мы юзаем обычный автоскейлер и...

Потому что карпентер гораздо более гибкий

Kirill Garbar
А почему карпентер? Мы юзаем обычный автоскейлер и...

Хотя бы потому что карпентер поднимает ноду за минуту

Igor
Хотя бы потому что карпентер поднимает ноду за мин...

Честно говоря я думал, что это зависит в основном от облака, а не автоскейлера. Но учту, спасибо

Kirill Garbar
Честно говоря я думал, что это зависит в основном ...

Конечно от облака) Чудес не бывает. Просто карпентер реагирует на "ситуацию" намного быстрее. И ещё там основное отличие в том, что он оперирует просто нодами, а не асг

Sebor▂▅▇█▓▒░
Конечно от облака) Чудес не бывает. Просто карпент...

Понял. Т.е. при переходе на него надо будет не только другой компонент задеплоить, но и логику создания кластера поменять. Т.е. быстрее может быть как раз за счёт того, что не добавляется задержка реакции автоскейлинг группы

Нравится фраза секунд за 30)

=) да, тоже порадовало увы, даже AWS Fargate который специально делали для быстрого старта это 60-90 секунд в AWS EKS + karpenter новая нода стартует минуты 3-10 а если очень жирная. то может и не стартовать вообще если в регионе таких машин нет а зачем вам куча CPU ядер? для ML же GPU больше нужен или у вас там много подготовки на CPU?

Мы используем pause pods чтобы всегда иметь фиксированное количество нод в резерве без нагрузки.

Anton Chaporgin
Мы используем pause pods чтобы всегда иметь фиксир...

Это поды которые сами генерят нагрузку?

A
Это поды которые сами генерят нагрузку?

да. они занимают ноду, чтобы даунскейлинг не произошел

Похожие вопросы

Обсуждают сегодня

я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
в сях есть множество как в питоне? для удаление дубликатов
Linus
25
читать файл максимально быстро? странный вопрос))
zamtmn
53
тоесть, указав return eax, сгенерируется никому ненужная инструкция mov eax,eax ?
Aiwan \ (•◡•) / _bot
24
How to create an OS in C? what to study?
Linus
18
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
Всем доброго вечера! Хочу поделиться своим злоключением с человеком, который, как оказалось сюда тоже скидывал свое резюме. Жаль, что я вашу группу не нашел раньше… человек ки...
Роман Ахмедзянов
4
а как бы вылезти из ИО, что то типа IO -> Ether или в какую сторону смотреть ? что то туплю
Fedor
9
Компания Elif ищет менеджера проектов, который будет заниматься поиском и ведением новых проектов. Прежде чем приступить к работе, вам нужно пройти наш недельный курс, где вы ...
Elif
5
Привет, кто может сделать юзербота с апи? Задачи: - создавать группы - создавать каналы - задавать для созданных каналов аватарку или эмоджи, имя группы - добавлять в группы...
Lencore
11
Карта сайта