лучше
Есть здоровая база (солидный кусок русскоязычного телеграмма, 700млн постов) Хочу сделать поиск по ней, пока работает медленно. Возникла идея сделать тематические словари, типа "кулинария" "айти",
1. Может лучше какой-нибудь специализированный поисковый движок? Если то, что есть в ПГ не идеально, и приходится дорабатывать напильником... 2. Я не очень понял ваш план про отдельный индекс для каждой тематики. При поиске по темам всё равно ищут "обычные" слова, эти обычные слова займут больше половины объёма. Несколько индексов — суммарный объём больше, чем если всё в один индекс
1. Спасибо, надо покурить мануалы) 2. Хз точно, что я хочу, пока думаю))
1. Если вам максимальную скорость - то SphinxSearch или ManticoreSearch и сразу смотреть ondisk_attrs, чтобы он не тащил всю базу в оперативку. Даже в этой ситуации об будет на пару порядков быстрее постгреса.
А они норм? У нас на работе был сфинкс, теперь- Мантикора, что-то качество поиска так себе, но мб они криво настроены были
С lemmatizer_ru_all - нормально, а со stem_ru или stem_ru_en такая же лажа, как в комплекте с постгресом.
А, ну у меня в постгресе словарь rusmorph, он норм+-
Rusmorph так и не попробовал пока, но по описанию он делает примерно то же, что сфинксовый lemmatizer_ru или lemmatizer_ru_all. Так-то хотел бы сфинкса выкинуть, но вот чтобы морфология + скорость + быстрое ранжирование + гибкое ранжирование (на уровне запроса сказать, чтобы повышал ранг за точное совпадение, например, ищу «холодный» и чтобы «холодный» был выше, чем «холодная») пока никого не вижу.
Обсуждают сегодня