миллионами записей и 16 гигами на винчестере. У неё десяток с лишним полей имеют тип longtext, и на них full-text индексы. Если делать поиск только по одному из этих полей, работает ок. Если я полнотекстовый поиск комбинирую, например с WHERE ID > 20000, в лучшем случае 2 минуты запрос занимает, в худшем, вылетает с ошибкой, что не хватает памяти. Тут можно что-нибудь сделать, или надо переходить на NoSQL?
Суть в том, что если ты ищешь по одному индексу, то у тебя (если всё ок) тупо работает поиск по индексу, который при хорошем стечении обстоятельств (большой селективности критерия отбора) даст тебе мало записей, и соотв. всё ок. А если ты используешь два индекса, то во-первых, селективность критерия отбора разбивается на две части, и поскольку селективность совокупности критериев это произведение отдельных селективностей, а селективность части из совокупности критериев, наоборот, частное, то селективность в этом случае очень резко падает , т.е. критерий поиска по одному индексу даёт тебе резко (на порядки) больше записей. во-вторых, поскольку используется несколько индексов, то даже если СУБД умеет использовать несколько индексов в запросе, то она должна сделать сначала поиск по одному, затем по другому, потом сделать пересечение двух множеств, производительность этой операции не самая лучшая в мире. Т.е. это всё будет медленно во всех случаях. NoSQL тут ничего не решает, там всё то же самое, только без SQL.
Обсуждают сегодня