индексы по фильтру Блума при создании таблиц? и как лучше составлять в них выражения.
https://altinity.com/blog/clickhouse-black-magic-skipping-indices https://altinity.com/blog/skipping-indices-part-2-bloom-filters
Спасибо за ссылку! Есть, однако, один момент, который не освещен. В случае фильтра Блума, возможно ли использовать в описании индекса не просто указание на поле таблицы со строковым типом, а функцию, например, lowerUTF8(s). В моей таблице записанные данные о товарах на сайте. Названия товаров описаны прописными буквами. Таблица создана для дашборда в котором наши сотрудники используют текстовый фильтр по поиску товара. Набирают они, как правило, первые 3-4 символа строчными буквами. Заметил, что запросы к таблице с индексом в котором прописана функция lowerUTF8(s), при использовании в блоке WHERE той же функции lowerUTF8(s) like '%***%' равно работает в десять раз медленнее чем без функции. Как же быть? 1. Имеет смысл ли использовать функции в индексе? Если да, то какие? 2. Как правильно тогда составлять секцию WHERE? 3. Надо ли специально добавлять секцию PREWHERE? Заранее спасибо за ответ, если знаете.
1. Да, если запрос использует функцию 2. Такой же expression как в индексе или primary key. 3. PREWHERE для фильтрации по малому количеству колонок при чтении большого количества колонок если фильтр с низким selectivity
selectivity - это какой-то параметр чего-то ?
это понятие обозначающие насколько конкретное условие хорошо или плохо фильтрует записи.
если фильтр оставляет 1 строку из 10000 selectivity=1/10000 (низкий) если фильтр оставляет 9999 строку из 10000 selectivity=9999/10000 (высокий)
Уяснил, спасибо.
Обсуждают сегодня