Cloud), размер данных на текущий момент - около 8 ГБ, 2 целевых коллекции - одна на 10К-15К записей, вторая - пол милиона записей
- Вся остальная инфраструктура (EC2, Lambda, S3 и т.д.)
Нужно:
- Подключить к этим данных BI тулзу - tableau online (!), power bi, aws quicksight (предпочтительнее первая, но лично я хочу подружится с последней)
Проблема: Структура коллекции в монге достаточно денормализированная, есть уровни вложенности - не очень для аналитики. + к монге, даже через eё BI-коннектор, не все BI-сервисы могут к ней приконектится.
----
Как хочу решить: смигрировать данные с монги в какой-то более плоский вид, RDS/Aurora или что-то завязаное на aws athena, ну и настроить постоянную синхронизацию данных (как - нз). Но я не понимаю как эти данные смигрировать и делать их синхронизацию? AWS предоставляет какие-либо сервисы для этого? + Насколько они будут быстро обрабатывать данные - BI-сервисы по идее на них будут гонять запроссы-аггрегатки, - никто не хочет ждать 15+ минут пока отобразится диаграмма
Попробуйте Glue каталог для монги через JDBC драйвер. Он как раз выдаст плоскую структуру, с которой легко уже в том же QuickSight работать. Потом можно еще повесить сверху Athena, допустим. Обычный паттерн, используется также поверх слабоструктурированных данных в S3, например
Обсуждают сегодня