Почему именно из файла надо напрямую?

16 ответов

10 просмотров

предполагаю так быстрее? если нужен именно этот файл и все колонки в файле - быстрее наверное прочитать паркет файл из s3 из одного из экзекьюторов, чем прогонять запрос select * from file через query engine?

Макар- Автор вопроса
Pavel Tarasov
предполагаю так быстрее? если нужен именно этот фа...

Не уверен. Возможно первый вариант под собой будет нести не только "прочитать файл", а еще какие-то манипуляции, которые query engine делает за нас.

Макар
Не уверен. Возможно первый вариант под собой будет...

Ну вот мой внутренний заказчик клянется что не будет никаких изменений и они хотят это читать с минимальной задержкой, предпологаю что чтение просто файла будет быстрее всего.

Pavel Tarasov
Ну вот мой внутренний заказчик клянется что не буд...

Пишешь в файлы. Берешь это и все https://duckdb.org/ весь твой двх решен

Хм. А аналитики типа в джупитер ноутбуках это будут использовать? А когда не влезет в память?

Pavel Tarasov
Ну вот мой внутренний заказчик клянется что не буд...

кликхаус еще для таймсериез хорошо заходит.

Konstantin Sh S.
https://duckdb.org/docs/guides/python/jupyter.html

я может проглядел, но не понимаю все еще как это поможет если надо будет в память сложить что-то больше, чем память ноутбука

Vitaly Pismarev
кликхаус еще для таймсериез хорошо заходит.

но если требование чтобы лежало в файлах в открытом формате то тут вариантов особо и нет.

Vitaly Pismarev
кликхаус еще для таймсериез хорошо заходит.

да, но я так понял там специалиазация на широких таблицах, денормализованные данные, читаем только часть колонок. я пока планировал наоборот отчистить все таймсерии, вынести все метаданные отдельно и хранить как узкие таблицы. можно конечно денормализовать это все, но это прям большое изменение в дизайне. и к тому же тогда часть данных надо будет держать в кликхаусе, а часть в файлах все равно, не хочу такое

Pavel Tarasov
да, но я так понял там специалиазация на широких т...

Очень много всяких контор хранят таймсериес в КХ, просто вертикальные таблицы, работает для всяких сложных запросов лучше чем timeseriesDB

Pavel Tarasov
просто в виде sensor_id,timestamp,value?

метрики всякие удобно еще хранить и потом визуализировать в графане

Vitaly Pismarev
метрики всякие удобно еще хранить и потом визуализ...

но у меня не совсем как у метрик вроде паттерн использования

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Привет!) Кто как юзает переменные в строках?) Чисто ради интереса Вот так: echo "У меня {$bananasAmount} бананов"; Или вот так: echo "У меня ${bananasAmount} бананов";
Виталий
3
разработчик ботов скидывает портфолио, боты которые он уже создал. А вот как узнать что это именно он их создал?
Gosudar
4
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Карта сайта