нас арго пока не впроде. А флаксом катится платформа и как-то флаксом больше пользоваться не хочется. Может быть, конечно, у арго своих косяков вагон, не знаю.
арго совершенен, еретик!
Это возможно, я не знаю :)
Почему ?
Мне очень не нравится хельм таймаут. Т.е. эта синхронность убивает всю асинхронность куба. От этого таймаута случается всякое типа релизы в failed state. С арго я такого не видел. Иногда происходят какие-то баги и релиз хельма в каком-то неконсистентном состоянии - реконсайл не помогает. Это (непонятные баги) происходят реально редко, и пофиксить помогает только ручное вмешательство. На более-менее больших объёмах (50 кластеров, 20 релизов в каждом) это становится заметным. Основная причина это этот таймаут. А если wait отключить, то не будет обратной связи по установке релиза. Ну и если хельм контроллер убить в момент установки релизов, то велик шанс, что все релизы, которые были в прогрессе встанут раком и поможет только ручное редактирование метаинформации хельма (удаление секретов). Но я лично арго не занимался и в проде его у нас пока нет. Арго используется для установки приложения. Может быть и с арго там будет жопа какая-нибудь другая.
С арго кучи жопы другой будет. Касательно хельма - у тебя в принципе хельм как концепция изначально калечная. И в арго придумали худший способ реализовать установку хельмов через отдельный темплейт. Ну, чо, молодцы
Ну посмотрим. Мои претензии к флаксу это скорее претензии к самому хельму.
Эт да. Через кастомайзы все классно катается
Начнёшь нагружать, увидишь. ,App unknown state Helm build failed App sync failed Топ 3 ошибок, с которыми приходят по арго сд
У нас где-то 40 окружений (namespace). В каждом наверное по 50-100 приложений. Пользуются команды разработки. Таких проблем пока не видели. Но может быть когда арго пойдёт дальше, увидим. Там будет порядка 400-450 приложений в одной ns. Ну и у нас кастомный образ, который деплоит, потому что используется helmfile.
Вы уверены что 450 приложений помноженных на пару реплик в одном ns это ок?)
Не у всех есть поды, скажем так. Я уверен, что это дохрена и это неок.
Почему нет, кроме как "фу не красиво"?
Не могу аргументировать, Но что-то внутри говорит что так делать не стоит 🫡
Например helm ls отрабатывает очень долго и часто отваливается по таймауту. На этом запросе построены некоторые qa проверки. Параллельный деплой из пайплайна может отваливаться по таймауту, потому что хельм перед деплоем получает секреты и тоже может отваливаться по таймауту.
Дак это проблемы хельма, ну
Ну это проблемы в итоге наши, а не хельма :)
Обсуждают сегодня