Почему именно из файла надо напрямую?

16 ответов

5 просмотров

предполагаю так быстрее? если нужен именно этот файл и все колонки в файле - быстрее наверное прочитать паркет файл из s3 из одного из экзекьюторов, чем прогонять запрос select * from file через query engine?

Макар- Автор вопроса
Pavel Tarasov
предполагаю так быстрее? если нужен именно этот фа...

Не уверен. Возможно первый вариант под собой будет нести не только "прочитать файл", а еще какие-то манипуляции, которые query engine делает за нас.

Макар
Не уверен. Возможно первый вариант под собой будет...

Ну вот мой внутренний заказчик клянется что не будет никаких изменений и они хотят это читать с минимальной задержкой, предпологаю что чтение просто файла будет быстрее всего.

Pavel Tarasov
Ну вот мой внутренний заказчик клянется что не буд...

Пишешь в файлы. Берешь это и все https://duckdb.org/ весь твой двх решен

Хм. А аналитики типа в джупитер ноутбуках это будут использовать? А когда не влезет в память?

Pavel Tarasov
Ну вот мой внутренний заказчик клянется что не буд...

кликхаус еще для таймсериез хорошо заходит.

Konstantin Sh S.
https://duckdb.org/docs/guides/python/jupyter.html

я может проглядел, но не понимаю все еще как это поможет если надо будет в память сложить что-то больше, чем память ноутбука

Vitaly Pismarev
кликхаус еще для таймсериез хорошо заходит.

но если требование чтобы лежало в файлах в открытом формате то тут вариантов особо и нет.

Vitaly Pismarev
кликхаус еще для таймсериез хорошо заходит.

да, но я так понял там специалиазация на широких таблицах, денормализованные данные, читаем только часть колонок. я пока планировал наоборот отчистить все таймсерии, вынести все метаданные отдельно и хранить как узкие таблицы. можно конечно денормализовать это все, но это прям большое изменение в дизайне. и к тому же тогда часть данных надо будет держать в кликхаусе, а часть в файлах все равно, не хочу такое

Pavel Tarasov
да, но я так понял там специалиазация на широких т...

Очень много всяких контор хранят таймсериес в КХ, просто вертикальные таблицы, работает для всяких сложных запросов лучше чем timeseriesDB

Pavel Tarasov
просто в виде sensor_id,timestamp,value?

метрики всякие удобно еще хранить и потом визуализировать в графане

Vitaly Pismarev
метрики всякие удобно еще хранить и потом визуализ...

но у меня не совсем как у метрик вроде паттерн использования

Похожие вопросы

Обсуждают сегодня

if (user?.choseType === 'oneDay') { await ctx.reply( 'Добро пожаловать в команду «Магнита»! Правда, на один день ☺️ ', ); await ctx.s...
Kokni
1
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Это фейк @cruppto_newbot?
Antskup
13
всем салют сегодня утро заметил что бот не может отправлять фотки по url. ручками в браузере ссылка норм открывает фотки. падает ошибка 'Bad Request: failed to send message ...
Vasya Ivanov
9
ребят, привет. за какое время бот полученную заявку на вступление в группу может принять \отклонить? Помню речь была про 5 минут, сейчас как?
Роман Ромашин :)
10
Доброго времени суток. Правильно ли я понимаю, что с введением новой платежной единицы stars, я просто могу оставить текущую платёжку от Юкассы, которая выполняется на сайте с...
Prokhor Chulkov
7
Добрый день! Не подскажете как к модели Категории Шопоголика добавить отношение Тейлора. Пробовал по документации, но не получается. Мб уже кто-то делал?
Николай Афанасенко
6
Добрый день! На Odoo 16.0 через 1-2 дня перестают работать кроны. В логах одна только ошибка на момент, когда сработал последний крон. Может кто-то уже с этим разбирался?
Denis Валенчиц
3
https://pastebin.com/BC4pjp4u кто-нибудь мне может объяснить почему это так работает и как работает правильно wizard и почему иногда в контекст появляются сообщения от бота, н...
Kokni
1
вопрос: кто как решает вопрос с динамической подгрузкой скриптов для отдельных страниц с включенным turbo router?
Sergei Toroptsev
25
Карта сайта