не по частоте встречаемости, а, например, по сумме какого-то числового поля?
Например, есть колонка URL и колонка bytes_sum.
Вызвать topK(10)(URL, bytes_sum) и получить 10 URL, по которым больше всего суммарное количество байт.
Кажется, что не особо сложные, в качестве инкремента передать значение этого поля.
Или есть какие-то подводные камни?
а что мешает сделаеть что то вида: SELECT url, sum(bytes_sum) sm FROM table GROUP BY url ORDER BY sm DESC LIMIT 10 ?
Совсем не сложные доработки. Структура данных внутри уже поддерживает веса.
Обсуждают сегодня