Коллеги, всем привет! У меня есть airflow (уже развернутый и работающий)

и готовый локально docker контейнер со spark логикой.
Мне нужно, чтобы airflow для определенной таски пошел в kubernetes кластер, поднял там имеющийся контейнер со spark, и запустил там спарк джобу.
С кубернетисом я никогда не работал

Отдельного спарк кластера нет, нужно делать это через кубернетис.
Подскажите, я в целом правильно понимаю пайплайн?

0) Видимо, сначала нужно где-то в реджистри кубернетиса зарегистрировать этот docker образ со спарком (если такое вообще есть у него? Если нет, то как доставить на кубернетис нужный контейнер?
1) Затем нужно сделать новый под kubernetespodoperator'ом на основе этого образа?
2) Затем после этого отправить на этот под команду, видимо, этим оператором

Приветствуются любые комментарии/мысли по тому, как правильно заставить работать связку Airflow+Spark+k8s
Спасибо!

7 ответов

31 просмотр

1. Ставишь k8s 2. В него хелмом деплоишь оператор 3. В airflow в сокдинения прокидываешь ключ кубера 4.пишешь даг и выкидываешь туда Спарк оператор таску деплоишь манифест 5. Profit

_
а потом говорят что быть dataops сложно )

ну на медиуме статей 5 или 6 про это есть

лучше настроить Airflow для запуска задачи Spark непосредственно внутри кластера Kubernetes с помощью KubernetesExecutor. Это позволит Airflow создавать и управлять подами Spark внутри кластера Kubernetes, а не запускать их в отдельных контейнерах. Или я не так прочел

Vitalik- Автор вопроса
Alisher Umarov
лучше настроить Airflow для запуска задачи Spark н...

Спасибо за ответ! Я за любой бест-практис-движ. Пока не доводилось пользоваться кубером, поэтому написал как ориентировочно это представляю. В целом имел в виду, что этот готовый докер контейнер должен подняться в кубернетисе (ну я так думаю), по команде таски из эирфлоу. И следующей командой спарк должен запуститься внутри этого контейнера внутри кубернетис кластера (ну или это все одной командой делается? хз) Можешь пожалуйста скинуть ссылок на кубер операторы, которые могут понадобиться, про которые почитать?

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Привет!) Кто как юзает переменные в строках?) Чисто ради интереса Вот так: echo "У меня {$bananasAmount} бананов"; Или вот так: echo "У меня ${bananasAmount} бананов";
Виталий
3
разработчик ботов скидывает портфолио, боты которые он уже создал. А вот как узнать что это именно он их создал?
Gosudar
4
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
кто-нибудь уже пробовал это?
Lencore
4
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
❓ Подскажите как сделать в группе телеги функцию (кнопку) пересылки сообщения где есть нарушение правил? Бот к каждому сообщению (по определенным ключам) добавляет снизу кнопк...
Alexander
4
Карта сайта