184 похожих чатов

Привет всем, есть какой-то универсальный способ для поиска по тексту?

Сейчас разбиваем строку на массив слов и потом hasAll(array, [‘hot, 'dog’]) по нужным словам

12 ответов

18 просмотров

Есть. Elasticsearch, например.

снаружи проверяете, что в результирующем массиве нет 1, но кх под это не заточен https://clickhouse.tech/docs/ru/sql-reference/functions/string-search-functions/#multisearchallpositions

https://clickhouse.tech/docs/en/engines/table-engines/mergetree-family/mergetree/#available-types-of-indices ngram data skip index можно попробовать, но это не полнотекстовый поиск ни разу

Bogdan-Kolesnik Автор вопроса
Slach [altinity]
https://clickhouse.tech/docs/en/engines/table-engi...

Как раз полнотекстовый не нужен, попробую

Slach [altinity]
https://clickhouse.tech/docs/en/engines/table-engi...

Я кстати так и не смог найти настройки, с которыми бы ngram индекс бы действительно что-то существенно ускорял для фильтрации текста логов :(. Может у кого-то есть пример?

Slach [altinity]
https://clickhouse.tech/docs/en/engines/table-engi...

Собственно, кажется с Вами я это и обсуждал год назад :). https://m.habr.com/ru/post/512084/comments/#comment_21885266

Yuran
Я кстати так и не смог найти настройки, с которыми...

Могу себе представить, что для поиска редко встречающихся значений он может подойти

Dmitry [Altinity] Titov
Могу себе представить, что для поиска редко встреч...

Теоретически — безусловно. Меня лично больше интересуют конкретные настройки, которые подходят для логов :). По ссылке выше я описывал свои варианты, которые пробовал.

Yuran
Теоретически — безусловно. Меня лично больше интер...

Для практики нужен датасет и ограниченных круг хотелок.

Yuran
Я кстати так и не смог найти настройки, с которыми...

ну .. у вас же врое получалось что-то около 2х раз ускорить? но в целом тут такое дело что data skip index существенно будут ускорять только если вы ищете что-то редкое. потому что оно проверяет не то что в данном парте искомый токен есть. а то что в данном парте искомого токена нет а если токен высокочастотный и есть в 100% партов, то наверное оно даже и замедлится слегка

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
как быть с принтером? такой подход прокатит?
zamtmn
12
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Карта сайта