Metastore, каждый наполнялся отдельно.т.е. 2 разных каталога. Сейчас понадобилось объединять таблицы из обоих. Доступ к данным есть. Нужно как-то синхронизировать эти каталоги с переопределением схем. Кто-то делал такое?
Я б взял жавовский клиент и на жяве / скале б написал скрипт для этого. Но ты имеешь ввиду что именно? Только таблички или все партишоны?
Вообще, в спарке вроде можно 2 каталога иметь и из 2 кластеров тянуть данные, подключаясь к 2 метасторам поочередно. Типа - подключился к 1, забрал данные, закешил. Подключился к другому, выгрузил в другую фс и заполнил метадату..
Там достаточно нетривиальный АПИ, правда. Много времени займет
Оказалось, можно в своем Hive зарегать чужие таблицы с помощью Trino, коннектор deltaLake позволяет это делать. Как изначально и планировалось. Так что проблема решилась. Спасибо
Обсуждают сегодня