Коллеги, всем привет! У меня есть airflow (уже развернутый и работающий)

и готовый локально docker контейнер со spark логикой.
Мне нужно, чтобы airflow для определенной таски пошел в kubernetes кластер, поднял там имеющийся контейнер со spark, и запустил там спарк джобу.
С кубернетисом я никогда не работал

Отдельного спарк кластера нет, нужно делать это через кубернетис.
Подскажите, я в целом правильно понимаю пайплайн?

0) Видимо, сначала нужно где-то в реджистри кубернетиса зарегистрировать этот docker образ со спарком (если такое вообще есть у него? Если нет, то как доставить на кубернетис нужный контейнер?
1) Затем нужно сделать новый под kubernetespodoperator'ом на основе этого образа?
2) Затем после этого отправить на этот под команду, видимо, этим оператором

Приветствуются любые комментарии/мысли по тому, как правильно заставить работать связку Airflow+Spark+k8s
Спасибо!

7 ответов

21 просмотр

1. Ставишь k8s 2. В него хелмом деплоишь оператор 3. В airflow в сокдинения прокидываешь ключ кубера 4.пишешь даг и выкидываешь туда Спарк оператор таску деплоишь манифест 5. Profit

_
а потом говорят что быть dataops сложно )

ну на медиуме статей 5 или 6 про это есть

лучше настроить Airflow для запуска задачи Spark непосредственно внутри кластера Kubernetes с помощью KubernetesExecutor. Это позволит Airflow создавать и управлять подами Spark внутри кластера Kubernetes, а не запускать их в отдельных контейнерах. Или я не так прочел

Vitalik- Автор вопроса
Alisher Umarov
лучше настроить Airflow для запуска задачи Spark н...

Спасибо за ответ! Я за любой бест-практис-движ. Пока не доводилось пользоваться кубером, поэтому написал как ориентировочно это представляю. В целом имел в виду, что этот готовый докер контейнер должен подняться в кубернетисе (ну я так думаю), по команде таски из эирфлоу. И следующей командой спарк должен запуститься внутри этого контейнера внутри кубернетис кластера (ну или это все одной командой делается? хз) Можешь пожалуйста скинуть ссылок на кубер операторы, которые могут понадобиться, про которые почитать?

Похожие вопросы

Обсуждают сегодня

if (user?.choseType === 'oneDay') { await ctx.reply( 'Добро пожаловать в команду «Магнита»! Правда, на один день ☺️ ', ); await ctx.s...
Kokni
1
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Это фейк @cruppto_newbot?
Antskup
13
всем салют сегодня утро заметил что бот не может отправлять фотки по url. ручками в браузере ссылка норм открывает фотки. падает ошибка 'Bad Request: failed to send message ...
Vasya Ivanov
9
ребят, привет. за какое время бот полученную заявку на вступление в группу может принять \отклонить? Помню речь была про 5 минут, сейчас как?
Роман Ромашин :)
10
Доброго времени суток. Правильно ли я понимаю, что с введением новой платежной единицы stars, я просто могу оставить текущую платёжку от Юкассы, которая выполняется на сайте с...
Prokhor Chulkov
7
Добрый день! Не подскажете как к модели Категории Шопоголика добавить отношение Тейлора. Пробовал по документации, но не получается. Мб уже кто-то делал?
Николай Афанасенко
6
вопрос: кто как решает вопрос с динамической подгрузкой скриптов для отдельных страниц с включенным turbo router?
Sergei Toroptsev
25
@veranikaEU получилось? Можно увидеть рабочий код?
Alex Kom
8
Добрый день! На Odoo 16.0 через 1-2 дня перестают работать кроны. В логах одна только ошибка на момент, когда сработал последний крон. Может кто-то уже с этим разбирался?
Denis Валенчиц
3
Карта сайта