Cloud), размер данных на текущий момент - около 8 ГБ, 2 целевых коллекции - одна на 10К-15К записей, вторая - пол милиона записей
                  
                  
                  - Вся остальная инфраструктура (EC2, Lambda, S3 и т.д.)
                  
                  
                  Нужно:
                  
                  
                  - Подключить к этим данных BI тулзу - tableau online (!), power bi,  aws quicksight (предпочтительнее первая,  но лично я хочу подружится с последней)
                  
                  
                  Проблема: Структура коллекции в монге достаточно денормализированная, есть уровни вложенности - не очень для аналитики. + к монге, даже через eё BI-коннектор, не все BI-сервисы могут к ней приконектится.
                  
                  
                  ----
                  
                  
                  Как хочу решить: смигрировать данные с монги в какой-то более плоский вид, RDS/Aurora  или что-то завязаное на aws athena,  ну и настроить постоянную синхронизацию данных (как - нз). Но я не понимаю как эти данные смигрировать и делать их синхронизацию? AWS предоставляет какие-либо сервисы для этого? + Насколько они будут быстро обрабатывать данные - BI-сервисы по идее на них будут гонять запроссы-аггрегатки,  - никто не хочет ждать 15+ минут пока отобразится диаграмма
                  
                  
                
Попробуйте Glue каталог для монги через JDBC драйвер. Он как раз выдаст плоскую структуру, с которой легко уже в том же QuickSight работать. Потом можно еще повесить сверху Athena, допустим. Обычный паттерн, используется также поверх слабоструктурированных данных в S3, например
Обсуждают сегодня