каждыми соседними событиями auto_play должно быть одно из событий [auto_pause, rebuffer]."
Я пыталась решать её через массивы
groupArray(event_name) AS event_names,
arrayReverseSplit(name, splitter -> splitter, event_names, arrayMap(x -> x = 'auto_play', event_names)) AS name_intervals,
arrayFilter(name -> name[-1] = 'auto_play', name_intervals) AS auto_play_intervals,
arrayFilter(name -> hasAny(name, ['rebuffer', 'auto_pause']), auto_play_intervals) AS valid_name_intervals,
length(auto_play_intervals) AS cnt_intervals,
length(valid_name_intervals) AS cnt_valid_intervals
сравнивая потом, что cnt_intervals = cnt_valid_intervals. Этот метод не проходил в ограничение памяти (20 GiB).
Пыталась использовать sequenceCount
sequenceCount('(?1).*(?2).*(?3)')(device_timestamp,
event_name = 'auto_play',
event_name IN ('rebuffer',
'auto_pause'), event_name = 'auto_play')
Это выдавало ошибку Pattern application proves too difficult, exceeding max iterations (1000000).
Через windowFunnel ничего внятного не получилось.
Помогите пожалуйста)
а если set max_threads=1
А если без .* в sequenceCount?
т.е. нужно узнать, есть ли хотя бы одна цепочка (без других событий) auto_play, auto_pause|rebuffer, auto_play в пределах сессии?
Нет, между каждыми двумя событиями auto_play должно быть auto_pause|rebuffer, и при этом могут быть и другие события
ну их можно предварительно отфильтровать я думаю
sequenceCount игнорит те, что не в кондишнах
Чуть дополню, что можно это дело обойти https://kb.altinity.com/altinity-kb-functions/altinity-kb-sequencematch
всем спасибо за идеи, в итоге я оставила решение с массивами, предварительно выбрав сессии только с этими событиями :D
Обсуждают сегодня