Всем привет. Есть такая задача - в бакет, в landing

area прилетают csv файлы с некоторой периодичностью, примерно 500-1000 в день. Файлы размером 10mb-1gb, внутри IoT - логи с девайсов. Схема примерно одинаковая - device_id/sensor_id/metric_name/event_timestamp. Хочу строить некую реал тайм аналитику - что-нибудь типа окна за последний день по event_timestamp + долгосрочную аналитику - хранить историю и смотреть исторические данные по event_timestamp. Вопрос - как архитектуру лучше построить? Думал насчет кинезиса, но что-то смущает файлы по 100mb+ разбивать и пихать в кинезис

9 ответов

16 просмотров

Лямбда архитектура на Спарке?)

Конечно же спарком

Athena или redshift spectrum попробуй

Евгений Глотов
Конечно же спарком

Самый лутший парсер цсв

Мне казалось, эта задача плюс-минус решена? Кафка+Clickhouse Зачем тут Спарк непонятно. Это ж суть метрик, для которых КХ и придумали в Яндексе

Владислав Lazycat
Мне казалось, эта задача плюс-минус решена? Кафка+...

1) Чтобы иметь возможность легко делать что-то более сложное, чем SQL 2) В клике с изменения схем будешь гораздо больше отгребать

Евгений Глотов
1) Чтобы иметь возможность легко делать что-то бол...

Можно и в клике сделать без огребания от изменения схем. Писать csv как лог и поверх мат вью и уже во вью его разбирать. Если схема поменялась просто пересоздаем вью и если нужно можно забекфилить данные в основную таблицу.

Aleksandr- Автор вопроса

то есть просто сделать вью, который смотрит на бакет с этими csv? или там как-то в клик прогружать их надо?

Aleksandr
то есть просто сделать вью, который смотрит на бак...

Если нужен прям реалтайм то нужно что-то что данные с S3 перекидывает в клик. Из того что я использовал это вот эта штука https://vector.dev/docs/reference/configuration/sources/aws_s3/ но я лично работал не с S3 а с просто с EC2 логи перекидывал в клик.

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта