Приветствую! Можете пожалуйста подсказать: Какую архитектуру построения модели данных стоит использовать

в БД clickhouse?
Задача - сделать архитектуру для системы аналитики.

Как я понимаю, data valult не будет работать в силу того, что мы стараемся нормализовывать данные и наши разряженные индексы в таблице просто поетряют весь смысл и не будут эффективно работать. Мб стоит смотртеь в сторону Кимбола:

Разбивать источники на таблицы фактов и измерений. И по мере появления доп анилитики для бизнеса - делать новые таблицы на основе этих источников.

17 ответов

28 просмотров

Когда я задался похожими вопросами, люди делали наоборот, выбирали технологии под нужды бизнеса (бизнес логику/требования)

Никита- Автор вопроса
Arsen Gumin
Когда я задался похожими вопросами, люди делали на...

Ну т.е. для этого случая стоит поднять какой-нибудь gp и на нём расскатить data vault и оттуда уже перегонять в click для быстрого доступа и аналитики? Нужды такие: делать свою erp систему. Забирать разные источники и из них генерировать разные аналитические выгрузки и передавать их на бэк

Никита
Ну т.е. для этого случая стоит поднять какой-нибуд...

Я думаю так, да. Но опять же без нюансов)

Никита
Ну т.е. для этого случая стоит поднять какой-нибуд...

Мы юзаем spark. Spark'ом денормализуем таблицы, там где можем и кидаем в CH. А над кликом посажем уже Superset

Никита- Автор вопроса
Владислав Lazycat
Мы юзаем spark. Spark'ом денормализуем таблицы, та...

Ну, для спарка нужно много железа + это придётся самому раскатывать. К сожалению, этот вариант не подходит.

Мы в облаках. Там проще. У меня динамически кластер создаётся, считает и удаляется Только за квотами надо следить

Никита- Автор вопроса
Arsen Gumin
Я думаю так, да. Но опять же без нюансов)

Вот вопрос: А почему в целом не подходит вариант с Кимболом и в чем большое преимущество в data valut? Как я понимаю, у Кимбола проблема с большим количеством источников и с изменением данных. А data vault нужно вроде как использовать с кодогенерацией, только я пока что не очень понимаю, какие либы стоит юзать в этом случае ( вроде бы есть питонячая либа dbt )

не сочтите за наглость я также как-то начинал, вернее хотел начать сделать дата волт но... потом понял, что дата волт в принципе и не нужен)))) не всегда и не везде от него можно ощутить реальную пользу для 98% проектов архитектура будет гибрид Кимбалл - Инмон (да простят меня эти Отцы современных хранилищ) а прям по методологии Инмон наверно построен у 1% крупные компании, типа Яндекса, которые могут и вынуждены себе позволять требующей высокой квалификации архитектуры, и то упираются во всякие гибриды а-ля Data Vault 2.0 & Anchor (и назвали это hnhm) в общем, начните с простейшего - Кимбалла. Дальше по мере роста сложности задач.

Husan
не сочтите за наглость я также как-то начинал, ве...

Ну кимбал это уже 3нф, можно хуячить прям широкие витрины

Dmitry Zuev
Ну поясни

Кимбалл - это денормализация, какая 3нф? Прям широкие витрины - это скорее OBT, т.е джойн кимбалловской таблицы фактов с измерениями

Danny
Кимбалл - это денормализация, какая 3нф? Прям широ...

Кимбал проповедовал 3нф. Где-то в конце 90х был моделинг манифест

Похожие вопросы

Обсуждают сегодня

if (user?.choseType === 'oneDay') { await ctx.reply( 'Добро пожаловать в команду «Магнита»! Правда, на один день ☺️ ', ); await ctx.s...
Kokni
1
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Это фейк @cruppto_newbot?
Antskup
13
всем салют сегодня утро заметил что бот не может отправлять фотки по url. ручками в браузере ссылка норм открывает фотки. падает ошибка 'Bad Request: failed to send message ...
Vasya Ivanov
9
ребят, привет. за какое время бот полученную заявку на вступление в группу может принять \отклонить? Помню речь была про 5 минут, сейчас как?
Роман Ромашин :)
10
Доброго времени суток. Правильно ли я понимаю, что с введением новой платежной единицы stars, я просто могу оставить текущую платёжку от Юкассы, которая выполняется на сайте с...
Prokhor Chulkov
7
вопрос: кто как решает вопрос с динамической подгрузкой скриптов для отдельных страниц с включенным turbo router?
Sergei Toroptsev
25
Добрый день! Не подскажете как к модели Категории Шопоголика добавить отношение Тейлора. Пробовал по документации, но не получается. Мб уже кто-то делал?
Николай Афанасенко
6
@veranikaEU получилось? Можно увидеть рабочий код?
Alex Kom
8
Сonst magicTgHTML = (text, entities) => { let processedText = text; let offsetShift = 0; entities.forEach(entity => { const { offset, length, type, url, ...
Андрей
1
Карта сайта