хотим в неё писать показы, примерный рейт на вставку - 20-30 млн. в час, но нам не нужна сверхточность по секундам, нам достаточно точности "Дата ЧЧ:ММ". Хотелось бы как-то так: я лью в Кафку события показов, КХ все собирает и пишет в табличку, в итоге табличка группирует это значение, и я могу сделать запрос на псевдокоде: покажи кол-во показов у рекламодателя 123 за последний час. Он просуммирует все показы, выбрав строки с кол-вом показов поминутно для конкретного рекламодателя. Вопрос, как это организовать в таблицах: хранить все показы, и взять SummingMergeTree как аггрегацию? В доке как раз так и советуют. При рейте в 20-30 млн. в час слишком много строк получится.
Если планируете аналитику то историческую таблицу все равно придется хранить. А витрины можно сделать например через mat view чтобы они на лету аггрегировали данные и уже из них поставать запросами "покажи кол-во показов у рекламодателя 123 за последний час."
Обсуждают сегодня