терминах O-большое - сложность запроса в КХ вида : select user_id, count() from hits group by user_id/ Ответил O(log(n)) - скорее всего неправильно/ В сети информация противоречивая , например сложность группировки по версии вики - О(n) - те линейная/ Но это же не так - пофиг на n - запрос выполняется приблизительно одинаковое время вне зависимости от количества записей. А сын говорит - в любой непонятной ситуации - ставь O(n) : ))) Есть у кого какие мысли ?
Ну кликхаус будет читать все данные, так что O(n)
Но он будет читать все данные и при быстрой сортировке например/ Однако ее сложность O(n*log(n)) - разве нет ?
Возможно стоило уточнить как отсортированы данные в таблице, если уже по user_id то O(n) т.к. для агрегации достаточно далее просто пройтись по данным
нет - данные не отсортированы по user_id - это поле атрибутное для таблицы хитов.
O(n), при группировке используются хеши т.е. не увеличивают сложность. а то что там отсортировано или нет, только дает возможность стримить результат раньше и меньше памяти можно пользовать. но O такая же...
Обсуждают сегодня