Коллеги, всем привет! У меня есть airflow (уже развернутый и работающий)

и готовый локально docker контейнер со spark логикой.
Мне нужно, чтобы airflow для определенной таски пошел в kubernetes кластер, поднял там имеющийся контейнер со spark, и запустил там спарк джобу.
С кубернетисом я никогда не работал

Отдельного спарк кластера нет, нужно делать это через кубернетис.
Подскажите, я в целом правильно понимаю пайплайн?

0) Видимо, сначала нужно где-то в реджистри кубернетиса зарегистрировать этот docker образ со спарком (если такое вообще есть у него? Если нет, то как доставить на кубернетис нужный контейнер?
1) Затем нужно сделать новый под kubernetespodoperator'ом на основе этого образа?
2) Затем после этого отправить на этот под команду, видимо, этим оператором

Приветствуются любые комментарии/мысли по тому, как правильно заставить работать связку Airflow+Spark+k8s
Спасибо!

7 ответов

32 просмотра

1. Ставишь k8s 2. В него хелмом деплоишь оператор 3. В airflow в сокдинения прокидываешь ключ кубера 4.пишешь даг и выкидываешь туда Спарк оператор таску деплоишь манифест 5. Profit

_
а потом говорят что быть dataops сложно )

ну на медиуме статей 5 или 6 про это есть

лучше настроить Airflow для запуска задачи Spark непосредственно внутри кластера Kubernetes с помощью KubernetesExecutor. Это позволит Airflow создавать и управлять подами Spark внутри кластера Kubernetes, а не запускать их в отдельных контейнерах. Или я не так прочел

Vitalik- Автор вопроса
Alisher Umarov
лучше настроить Airflow для запуска задачи Spark н...

Спасибо за ответ! Я за любой бест-практис-движ. Пока не доводилось пользоваться кубером, поэтому написал как ориентировочно это представляю. В целом имел в виду, что этот готовый докер контейнер должен подняться в кубернетисе (ну я так думаю), по команде таски из эирфлоу. И следующей командой спарк должен запуститься внутри этого контейнера внутри кубернетис кластера (ну или это все одной командой делается? хз) Можешь пожалуйста скинуть ссылок на кубер операторы, которые могут понадобиться, про которые почитать?

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта