Всем добрый день! Подскажите, пожалуйста, никто не работал с dbt core?

А также связкой dbt с hdfs?
Нужна помощь с подключением dbt к hdfs для чтения файлов

22 ответов

34 просмотра

оно ж вроде только в сикуэль умеет

Annette- Автор вопроса
Nikita B
оно ж вроде только в сикуэль умеет

То есть к hdfs не удастся с помощью dbt подключиться?

Annette
То есть к hdfs не удастся с помощью dbt подключить...

подключиться можно, если у вас есть hive / trino для работы с hdfs тогда можно найти dbt - коннекторы к ним

Annette
То есть к hdfs не удастся с помощью dbt подключить...

Смотря что под этим понимается. Я не большой эксперт в дбт, но стоял рядом с человеком, который его натягивал на spark thrift server, а тот в свою очередь айсберги молол под капотом. Как-то даже работало.

Annette- Автор вопроса
Nikita B
Смотря что под этим понимается. Я не большой эксп...

у меня на hdfs лежат parquet файлы, данные в этих файлах нужно записывать в бд и все это с использованием dbt сделать, если это возможно

Annette
у меня на hdfs лежат parquet файлы, данные в этих ...

ну тогда вот как Андрей выше написал. поднять что-то, что принимает jdbc и умеет читать поркеты с hdfs и на него травить дбт.

Annette- Автор вопроса
Nikita B
ну тогда вот как Андрей выше написал. поднять что-...

по поводу dbt поняла, а подключиться к hdfs и считать файлы с помощью кода питона возможно? (если не использовать dbt) находила примеры только по подключению с использованием kerberos, можно ли использовать аутентификацию ldap (логин и пароль) для подключения?

Annette
по поводу dbt поняла, а подключиться к hdfs и счит...

Пайспарк всё сделает, коннектор дбт вроде есть

Annette
по поводу dbt поняла, а подключиться к hdfs и счит...

можно через pyarrow (ссылка ), но насчёт ldap не подскажу , надо смотреть документацию

Annette- Автор вопроса
Vitaly Pismarev
в какую БД?

в вертику, к самой бд подключение успешное и все отрабатывает нормально

Annette- Автор вопроса
Vitaly Pismarev
файлов много? Какие объемы?

да, файлов много и появляются новые каждый день. По объему все разные: от нескольких Мб до пару Гб

для такой задачи вам dbt вообще не нужен, dbt про T а не про интеграцию. Я бы попробовал примаунтить сетевой диск который был бы виден вертике и просто копировать туда паркеты которые потом перегонять в вертику. Или может в вертике есть интеграция с хадупом. Может еще что-то, но это точно не про dbt

Annette- Автор вопроса
Annette
поняла, спасибо!

вот когда зальете в вертику и их нужно во что-то для бизнеса трансформировать на сикуле, вот тут уже dbt и появляется

Annette- Автор вопроса
Vitaly Pismarev
вот когда зальете в вертику и их нужно во что-то д...

да, с этим я как раз разобралась, с трансформацией проблем нет. Этап заливки данных в бд из хдфс вызывает сейчас некую сложность

Annette
да, с этим я как раз разобралась, с трансформацией...

если можно сделать в вертике внешнюю таблицу на hdfs то тогда можно читать из хадупа. Но тут много нюансов, включая лицензию на такое решение )

чатгпт говорит что такие внешние таблицы в вертике существуют ) https://docs.vertica.com/23.4.x/en/data-load/working-with-external-data/creating-external-tables/

Vitaly Pismarev
чатгпт говорит что такие внешние таблицы в вертике...

только если у вас официальная лицензия на вертику нужно узнавать как такое ими тарифицируется. Если лицензии нет то пофиг )

Похожие вопросы

Обсуждают сегодня

Портфолио: Зовут меня Александр, мне 36 лет. Город Пушкино. Общий рабочий стаж: ~14 лет Уровень квалификации: Senior Full-stack developer Где прочесть мой код? https://github....
Magic
10
Ребят, привет. У кого-то есть опыт заказа мерча в сторе? Есть успешные кейсы? Чёт у меня турецкую карту не принимает
Vladimir F.
7
Всем привет. Есть кто разбирается в платежках? Что б принимать из других стран и выплачивать рф снг
Musa
6
Портфолио: Зовут меня Александр, мне 41 год. Город Киров. Общий рабочий стаж: ~14 лет Уровень квалификации: Senior Full-stack developer Где прочесть мой код? https://github.co...
Magic
11
Приветствую всех, есть вопросик. Передали проект на OctoberCms, без инсталяшки в полуразвернутом виде, нужно было залить бекап бд, после залития бд, оказалось, что части строк...
Лео
14
Есть магистры regex в чате? Задача: нужно написать regex который мэтчит полные (без сокращений по типу ::1/128) ipv6 адреса кроме 2001:0df7:cef7:29f7:52f7:adf7:2cf7:4ff7, при ...
Илья
5
Подскажите, пожалуйста, где в backende, или не в нем можно дату поправить? Логирует действия не в том часовом поясе
Лео
7
где собака, админ группы? нычкуется и боится проявить волю, в толерантность еще не наигрался? @yelizariev
Ognezar
61
всем привет. я правильно понимаю, что в телеграфе 4, если сессию указать у сообщения с коллбеком (кликнул на кнопку и установил сессию), то она не сохраняется?
Тимур
1
А как получить доступ к отправленному сообщению в ChosenInlineResult? Раньше кажется можно было, щас убрали?
net
2
Карта сайта