Привет всем, есть какой-то универсальный способ для поиска по тексту?

Question

ClickHouse не тормозит

Bogdan Kolesnik

Привет всем, есть какой-то универсальный способ для поиска по тексту?

Сейчас разбиваем строку на массив слов и потом hasAll(array, [‘hot, 'dog’]) по нужным словам

#backend #clickhouse #database #devops #programming #russian

0

26.03.2021

12 ответов

47 просмотров

Tagir Gumerov

снаружи проверяете, что в результирующем массиве нет 1, но кх под это не заточен https://clickhouse.tech/docs/ru/sql-reference/functions/string-search-functions/#multisearchallpositions

0

26.03.2021

Slach [altinity]

https://clickhouse.tech/docs/en/engines/table-engines/mergetree-family/mergetree/#available-types-of-indices ngram data skip index можно попробовать, но это не полнотекстовый поиск ни разу

0

26.03.2021

Bogdan Kolesnik Автор вопроса

Slach [altinity]
https://clickhouse.tech/docs/en/engines/table-engi...

Как раз полнотекстовый не нужен, попробую

0

26.03.2021

Dmitry [Altinity] Titov

Bogdan Kolesnik
Как раз полнотекстовый не нужен, попробую

https://habr.com/ru/post/304602/

0

26.03.2021

Yuran

Slach [altinity]
https://clickhouse.tech/docs/en/engines/table-engi...

Я кстати так и не смог найти настройки, с которыми бы ngram индекс бы действительно что-то существенно ускорял для фильтрации текста логов :(. Может у кого-то есть пример?

0

26.03.2021

Yuran

Slach [altinity]
https://clickhouse.tech/docs/en/engines/table-engi...

Собственно, кажется с Вами я это и обсуждал год назад :). https://m.habr.com/ru/post/512084/comments/#comment_21885266

0

26.03.2021

Dmitry [Altinity] Titov

Yuran
Я кстати так и не смог найти настройки, с которыми...

Могу себе представить, что для поиска редко встречающихся значений он может подойти

0

26.03.2021

Yuran

Dmitry [Altinity] Titov
Могу себе представить, что для поиска редко встреч...

Теоретически — безусловно. Меня лично больше интересуют конкретные настройки, которые подходят для логов :). По ссылке выше я описывал свои варианты, которые пробовал.

0

26.03.2021

Yuran

Yuran
Теоретически — безусловно. Меня лично больше интер...

(Я и есть youROCK на хабре, если что :))

0

26.03.2021

Dmitry [Altinity] Titov

Yuran
Теоретически — безусловно. Меня лично больше интер...

Для практики нужен датасет и ограниченных круг хотелок.

0

26.03.2021

Slach [altinity]

Yuran
Я кстати так и не смог найти настройки, с которыми...

ну .. у вас же врое получалось что-то около 2х раз ускорить? но в целом тут такое дело что data skip index существенно будут ускорять только если вы ищете что-то редкое. потому что оно проверяет не то что в данном парте искомый токен есть. а то что в данном парте искомого токена нет а если токен высокочастотный и есть в 100% партов, то наверное оно даже и замедлится слегка

0

27.03.2021

Nikita B · Accepted Answer

Nikita B

Есть. Elasticsearch, например.

0

26.03.2021

184 похожих чатов

Привет всем, есть какой-то универсальный способ для поиска по тексту?

12 ответов

Похожие вопросы