Подскажите, кто пользует dbt, можно ли парралелить запросы по шардам?

Question

Подскажите, кто пользует dbt, можно ли парралелить запросы по шардам?

Сейчас данные шардированы по приложениям и мы в самописном пайплайне просто запускаем одинаковый запрос в отдельном потоке на каждый шард, можно ли что-то такое сделать в dbt для ускорения?

#backend #clickhouse #database #devops #programming #russian

0

12.01.2022

7 ответов

43 просмотра

Konstantin Ilchenko Автор вопроса

Дмитрий Володин
Прописываете в profiles.yml подключение к каждому ...

Спасибо, а если усложнить, и надо много запросов на 1 шард, например разбиваем 1 жирный запрос чтобы в память укладывался через where app_id % 30 = {0..29}. Через dbt run --vars нормально делать? + автогенерация тасок в airflow

0

12.01.2022

Дмитрий Володин

Konstantin Ilchenko
Спасибо, а если усложнить, и надо много запросов н...

dbt_users DBT users group Взаимное уважение и без спама. Для вакансий тег #job Dual language: russian/english https://t.me/dbt_users Вполне живое русскоязычное комьюнити. Там был ответ про union_relations макрос

0

12.01.2022

Konstantin Ilchenko Автор вопроса

Дмитрий Володин
dbt_users DBT users group Взаимное уважение и без...

Спасибо, изучу, но на первый взгляд это что-то для объединения, а не разбития запроса)

0

12.01.2022

Дмитрий Володин

Konstantin Ilchenko
Спасибо, изучу, но на первый взгляд это что-то для...

Ну а объединять-то данные потом как будете?))

0

12.01.2022

Konstantin Ilchenko Автор вопроса

Дмитрий Володин
Ну а объединять-то данные потом как будете?))

так они пишут в 1 таблицу, объединять ничего не надо) Просто 1 запрос на вставку разбивается на 30 маленьких

0

12.01.2022

Дмитрий Володин

Konstantin Ilchenko
так они пишут в 1 таблицу, объединять ничего не на...

Короче, почитайте. Может это то, что нужно. У меня таких проблем не возникало, только при initial load. Там тупо циклом с переменным делал

0

12.01.2022

Дмитрий Володин · Accepted Answer

Дмитрий Володин

Прописываете в profiles.yml подключение к каждому шарду и используете при dbt run флаг --target *название таргета для шарда*. И так на каждый шард. Распараллелить можете в том же эйрфлоу, по таске на каждый шард

0

12.01.2022

184 похожих чатов

Подскажите, кто пользует dbt, можно ли парралелить запросы по шардам?

7 ответов

Похожие вопросы