Здравствуйте, подскажите, пожалуйста, как в правильно и эффективно в поле

искать подстроку в монге

Первый способ, который я пробовал - через regex .*substring.* получается слишком долгий запрос

Второй способ через полнотекстовый поиск с построением текстового индекса. Работает быстро, но ищет только по словам, а мне нужно именно каждое вхождение найти

Может есть какое-то другое быстрое и удовлетворяющее задаче решение?

3 ответов

16 просмотров

Поиск по подстроке в принципе сложная задача, так как подстроки очень дорого индексировать. К сожалению, для монги простой ответ «никак». Полнотекстовый индекс не поддерживает частичное совпадение по токену, только по его оригинальной словоформе. Нормализация происходит в момент обработки $text запроса, а дальше поиск по сути похож на поиск по multi-key индексу, с той разницей что «сортировка» будет по «коэффициенту совпадения» Если вы можете выделять нужные вам токены при записи, а это достаточно легко для иерархических строк, например FQDN, то эти токены можно хранить в индексируемом массиве. Если выделить подстроку при записи нельзя, то попробовать выделить префикс подстроки и записать её в индексируемый массив. В остальных случаях, дешевле использовать сторонний инструмент, который строит индексы через разновидности trie.

Morant- Автор вопроса
yopp 💉💉
Поиск по подстроке в принципе сложная задача, так ...

Спасибо огромное за развёрнутый ответ, читал про решение с разбиением строки на токены, но к сожалению, строки совсем не структурированы, буду рассматривать использование elasticsearch, так как он больше подходит для данной задачи

Morant- Автор вопроса
yopp 💉💉
Поиск по подстроке в принципе сложная задача, так ...

Вы упомянули сторонник инструмент с trie индексами, можете что-то посоветовать?

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Карта сайта