на одной БД. Ну то есть ок, есть у меня две бд - одна колоночная, кликхаус, другая классичемкая OLTP для профилей. Вот я выгребаю профили по полу, выгреб 1млн id. Далее как мне их сджойнить с кликхаусом? Я же не смогу сделать SELECT * FROM events WHERE user_id IN(1,….,1000000 миллион ид) Это надо писать свой распределенный мэп-редьюсер, выходит 🙂 Спарк или что там ещё.
Redash умеет делать джойн между базами, запихивая результат запросов в память. Для аналитики сойдёт, но не очень вебскейл, конечно :)
1 млн в IN влетает запросто)
Обсуждают сегодня