184 похожих чатов

Подскажите, кто пользует dbt, можно ли парралелить запросы по шардам?

Сейчас данные шардированы по приложениям и мы в самописном пайплайне просто запускаем одинаковый запрос в отдельном потоке на каждый шард, можно ли что-то такое сделать в dbt для ускорения?

7 ответов

8 просмотров

Прописываете в profiles.yml подключение к каждому шарду и используете при dbt run флаг --target *название таргета для шарда*. И так на каждый шард. Распараллелить можете в том же эйрфлоу, по таске на каждый шард

Konstantin Ilchenko- Автор вопроса
Дмитрий Володин
Прописываете в profiles.yml подключение к каждому ...

Спасибо, а если усложнить, и надо много запросов на 1 шард, например разбиваем 1 жирный запрос чтобы в память укладывался через where app_id % 30 = {0..29}. Через dbt run --vars нормально делать? + автогенерация тасок в airflow

Konstantin Ilchenko
Спасибо, а если усложнить, и надо много запросов н...

dbt_users DBT users group Взаимное уважение и без спама. Для вакансий тег #job Dual language: russian/english https://t.me/dbt_users Вполне живое русскоязычное комьюнити. Там был ответ про union_relations макрос

Konstantin Ilchenko- Автор вопроса
Дмитрий Володин
dbt_users DBT users group Взаимное уважение и без...

Спасибо, изучу, но на первый взгляд это что-то для объединения, а не разбития запроса)

Konstantin Ilchenko- Автор вопроса
Дмитрий Володин
Ну а объединять-то данные потом как будете?))

так они пишут в 1 таблицу, объединять ничего не надо) Просто 1 запрос на вставку разбивается на 30 маленьких

Konstantin Ilchenko
так они пишут в 1 таблицу, объединять ничего не на...

Короче, почитайте. Может это то, что нужно. У меня таких проблем не возникало, только при initial load. Там тупо циклом с переменным делал

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
что насчет пагинга? на осдеве непонятно(
Vi Chapmann 🪙
26
Народ, кто шарит в расширенных разделах (EBR/EPR) на дисках с разметками MBR? Везде пишут (в вики рус/англ) в частности + другие источники смотрел, что первый сектор расширенн...
Eugene Krasnikov (ᴊɪɴ x)
1
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
64
Ребят, что лучше для реверса: гидра или ида?
En Vind Av Sorg
26
Делаю велосипед логгер. К сообщению хочу прикрутить некоторую информацию, типа, кем отправлено, какой уровень, и всякое такое. И тут подумалось мне, почему бы не хранить весь...
Serjone
24
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
Всем привет! Использую gitlab-ci. Настроил gitlab-agent для деплоя в куб. При деплое проекта в логах такая ошибка: Executing deploy plan failed to watch "ns:my-project/Ingress...
Konstantin Moiseev
4
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Карта сайта