172 похожих чатов

Всем привет, хочу послушать умных людей) Делаю первый раз хранилище для

аналитики и хотел бы понять в правильном направление двигаюсь или нет:
Существует приложение, которое подключенно к сервису трекинга данных(событий), через этот сервис по API можно получать данные.
колво таблиц: будет 101 штука (отдельно каждая в CSV)
Объем всех таблиц за один день: порядка 100Гб
Структура таблиц всегда будет меняться

С данными нужно будет работать как в сыром виде для создание инсайтов, машшиного обучение в целом глубоки анализ
Так же данные нужно будет структурировать и отображать в Power BI
—-
Я решил сделать так:
1) С помощью Python сделал небольшой скриптик, который получает по АПИ данные с сервиса
2) Создал БД Postgres 11 в облаке Гугл
3) Создал две схемы (core_data - это исходники, analyst - препарированные данные, таблицы с индексами партиями и тд)
4) Python создает новую таблицу формата как получил CSV и загружает в нее данные
Потом с этой таблице определяет нужны колонки и загружает в core_date (архив)
5) В БД созданы view и процедуры, которые предназначены для очистки данных и создания нормализации таблиц и экспорта их в +/- реляционной структуре в схему analyst
6) Python запускает эти процедуры
7) в БД в схеме analyst формирую view matview для PowerBI
8) PowerBi через ODBC подключаю к этим вьюхам
Какие могут быть подводные камни?
заранее благодарен!

1 ответов

13 просмотров

> Какие могут быть подводные камни? При вливании очередных 100 гигов в день кончатся деньги, место не растянется и база упадёт.

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
как быть с принтером? такой подход прокатит?
zamtmn
12
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Карта сайта