у меня таблица (ts, session_id, event (START/SOMETHING/END))
и я хочу посчитать среднюю по больнице (среднее время между START-END внутри одной сессии, например)
есть ли какой-нибудь изящный способ это сделать? пока думал над следующими вариантами:
* запилить адовую аггрегацию с array-функциями и group by csid - не хватает оперативки
* запилить SummingMergeTree (csid, ts_buffer, counter), по событию START вставлять туда (csid, ts, 1), по событию END вставлять туда (csid, -ts, 1). Вроде должно работать очень быстро, но тут не ясно, что делать, когда counter%2!=0 (придется отбрасывать все данные, даже если там какие-то другие есть)
и что у session_id всегда одна пара start stop ?
может быть несколько
тогда только запросы с массивами
адъ, но спасибо
ну так а например как вы такое сделате в mysql ? или pg? или кассандре? надо данные готовить а не бездумно пихать все в базу в непригодном для запросов виде
сейчас что-то такое делает адовая куча сервисов, которая делает это все в памяти :) там и scylla, и elasticsearch. по всем пунктам согласен, этого в принципе и добиваюсь
так, а если может быть только одна пара событий - есть решение эффективнее?
session_id, minIf(event=start) b, maxIf(event=stop) e , e-b group by session_id
ну в принципе мой вариант для нескольких пар событий через sumIf(±ts) практически так же работает. только будут проблемы, если будет много непарных событий. думаю, жить можно
хотя можно поверх запилить anyLastIf(counter%2==0, sum)
вот кстати deltaSum появился еще, как будто бы сам просил
Обсуждают сегодня