172 похожих чатов

Создать отдельный "язык" для каждого столбца (предметной области)? расскажите исходную задачу

лучше

8 ответов

12 просмотров

Есть здоровая база (солидный кусок русскоязычного телеграмма, 700млн постов) Хочу сделать поиск по ней, пока работает медленно. Возникла идея сделать тематические словари, типа "кулинария" "айти",

alex-che Автор вопроса
Eshu Marabo
Есть здоровая база (солидный кусок русскоязычного ...

1. Может лучше какой-нибудь специализированный поисковый движок? Если то, что есть в ПГ не идеально, и приходится дорабатывать напильником... 2. Я не очень понял ваш план про отдельный индекс для каждой тематики. При поиске по темам всё равно ищут "обычные" слова, эти обычные слова займут больше половины объёма. Несколько индексов — суммарный объём больше, чем если всё в один индекс

alex che
1. Может лучше какой-нибудь специализированный пои...

1. Спасибо, надо покурить мануалы) 2. Хз точно, что я хочу, пока думаю))

Eshu Marabo
1. Спасибо, надо покурить мануалы) 2. Хз точно, чт...

1. Если вам максимальную скорость - то SphinxSearch или ManticoreSearch и сразу смотреть ondisk_attrs, чтобы он не тащил всю базу в оперативку. Даже в этой ситуации об будет на пару порядков быстрее постгреса.

Евгений Смирнов
1. Если вам максимальную скорость - то SphinxSearc...

А они норм? У нас на работе был сфинкс, теперь- Мантикора, что-то качество поиска так себе, но мб они криво настроены были

Eshu Marabo
А они норм? У нас на работе был сфинкс, теперь- Ма...

С lemmatizer_ru_all - нормально, а со stem_ru или stem_ru_en такая же лажа, как в комплекте с постгресом.

Евгений Смирнов
С lemmatizer_ru_all - нормально, а со stem_ru или ...

А, ну у меня в постгресе словарь rusmorph, он норм+-

Eshu Marabo
А, ну у меня в постгресе словарь rusmorph, он норм...

Rusmorph так и не попробовал пока, но по описанию он делает примерно то же, что сфинксовый lemmatizer_ru или lemmatizer_ru_all. Так-то хотел бы сфинкса выкинуть, но вот чтобы морфология + скорость + быстрое ранжирование + гибкое ранжирование (на уровне запроса сказать, чтобы повышал ранг за точное совпадение, например, ищу «холодный» и чтобы «холодный» был выше, чем «холодная») пока никого не вижу.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта