как вы храните код приложений? Хотя возможно этот вопрос актуален для любого варианта деплоя спарка.
В голову пришло пару вариантов:
1) собирать образ каждый раз, когда надо добавить новое
2) организовать доступ через какой-нибудь ресурс, например, volume подключить, где будет лежать код (или встречал в статейках на медиуме складывание кода в s3-бакет, который так же доступен из контейнера)
Можно жарки / пу файлики маунтить просто волюмами, наверное У меня спарк исполняет в основном HQL, так что я в оркестраторе собираю hql ( подставляю день в шаблон, например ) а потом spark-sql -f hdfs:///tmp/blah/a.hql
собирать в образ имхо
можно скурливать из нексуса последнюю версию джарника/петухон файла из гита
Собираем образ. Можно синкать код в готовый образ, но не нужно, это анти-паттерн. Деплои должны быть эфемерные и репродуцируемые.
Раз в час/день выкачать 20 Мб? Ну хз, образ по моему дороже пересобирать.
образ дороже, я согласен, поэтому предложил другой вариант)
и оба тезиса от одного и того же человека :)
Обсуждают сегодня