и пытаюсь понять, подходит ли он для наших задач или нет. Хочу услышать ваше мнение. Допустим, у меня есть запросы от пользователей и ответы на эти запросы. Запросы и ответы приходят не одновременно, а с разницей в несколько секунд. Мне нужно считать метрики по склеенным по идентификаторам запросам-ответам (потому что часть нужных полей есть в запросах, а часть в ответах). В связи с этим вопрос: правильно ли я понимаю, что без джойнов здесь не обойтись и, т.к. и запросы, и ответы не являются словарями, джойн по ним в КХ будет работать не оптимально?
Вам нужно до кликхауса собирать данные и бачами заливать в КХ
тут не нужен КХ, берите mysql. Если у вас в день меньше чем 100млн. ивентов то КХ это оверкилл.
у нас уже сейчас OLTP база, и она не вывозит, мы ищем вариант, на который лучше перейти
сколько ивентов в день?
Пока десятки миллионов, но в будущем ожидаем больше. К тому же, метрики ведь не только по дням нужно считать, но и по месяцам, годам... OLTP БД тяжело обрабатывать такие запросы
ну в общем джойните в OLTP и заливайте в КХ уже поджойненое в одну широкую таблицу, естественно с задержкой, когда все данные уже приехали в OLTP
поняла, спасибо за ответ!
Обсуждают сегодня