Привет! Подскажите, пожалуйста, как правильно организовать следующее: Дано: - MongoDB (Atlas

Cloud), размер данных на текущий момент - около 8 ГБ, 2 целевых коллекции - одна на 10К-15К записей, вторая - пол милиона записей
- Вся остальная инфраструктура (EC2, Lambda, S3 и т.д.)
Нужно:
- Подключить к этим данных BI тулзу - tableau online (!), power bi, aws quicksight (предпочтительнее первая, но лично я хочу подружится с последней)
Проблема: Структура коллекции в монге достаточно денормализированная, есть уровни вложенности - не очень для аналитики. + к монге, даже через eё BI-коннектор, не все BI-сервисы могут к ней приконектится.
----
Как хочу решить: смигрировать данные с монги в какой-то более плоский вид, RDS/Aurora или что-то завязаное на aws athena, ну и настроить постоянную синхронизацию данных (как - нз). Но я не понимаю как эти данные смигрировать и делать их синхронизацию? AWS предоставляет какие-либо сервисы для этого? + Насколько они будут быстро обрабатывать данные - BI-сервисы по идее на них будут гонять запроссы-аггрегатки, - никто не хочет ждать 15+ минут пока отобразится диаграмма

1 ответов

5 просмотров

Попробуйте Glue каталог для монги через JDBC драйвер. Он как раз выдаст плоскую структуру, с которой легко уже в том же QuickSight работать. Потом можно еще повесить сверху Athena, допустим. Обычный паттерн, используется также поверх слабоструктурированных данных в S3, например

Похожие вопросы

Обсуждают сегодня

Портфолио: Зовут меня Александр, мне 36 лет. Город Пушкино. Общий рабочий стаж: ~14 лет Уровень квалификации: Senior Full-stack developer Где прочесть мой код? https://github....
Magic
10
Портфолио: Зовут меня Александр, мне 41 год. Город Киров. Общий рабочий стаж: ~14 лет Уровень квалификации: Senior Full-stack developer Где прочесть мой код? https://github.co...
Magic
11
Приветствую всех, есть вопросик. Передали проект на OctoberCms, без инсталяшки в полуразвернутом виде, нужно было залить бекап бд, после залития бд, оказалось, что части строк...
Лео
14
Подскажите, пожалуйста, где в backende, или не в нем можно дату поправить? Логирует действия не в том часовом поясе
Лео
7
Есть магистры regex в чате? Задача: нужно написать regex который мэтчит полные (без сокращений по типу ::1/128) ipv6 адреса кроме 2001:0df7:cef7:29f7:52f7:adf7:2cf7:4ff7, при ...
Илья
5
Всем привет В общем надо на странице вакансии вывести вакансии с hh, но когда я пишу код в разделе Code ошибка Invalid URL format. The URL should start with the forward slash...
A da
1
где собака, админ группы? нычкуется и боится проявить волю, в толерантность еще не наигрался? @yelizariev
Ognezar
61
DataGrip не сканирует почему-то все таблицы, хотя раньше показывал их че за херня, сталкивались?
Magic
9
мне как апи hh написать?
A da
3
Привет! Подскажите может кто сталкивался, при создании купона выходит вот в таком виде окно. Как поправить это?
Ruslan
4
Карта сайта