есть у меня колонка 'domain' у которой могут быть значения от 0 до 100. и решил я добавить на нее индекс 'set(100)' и материализовал индекс потом. и в итоге получился запрос where domain=X стал выполняться в полтора раза медленнее. Это потому что разброс по значению такой что все равно во всех партах почти встречается X и из-за дополнительного лукапа по индексу стало еще медленнее? потому что сканирует все данные все равно да
да. Но теперь можно сделать прожекшин https://t.me/clickhouse_en/36650 отсортированный по domain и включить туда нужные поля, или сразу посчитать агрегаты и создать group by domain прожекшин
ага, да про прожекшены знаю - красивое.. и даже работает
Обсуждают сегодня