170 похожих чатов

Есть база записей, и нужно сделать поиск по ней такой,

что ищущий заранее знает, что ищет, но не помнит точного названия
и например, в базе есть "эээто бы ты....", и ты в поисковом запросе пишешь, как помнишь -- "это был ты" -- но вылазит вдруг "это тильт"
потому что
> Levenshtein.distance "это был ты", "это тильт"
=> 4
> Levenshtein.distance "это был ты", "эээто был ты...."
=> 6

есть какая-нибудь другая прикольная метрика вместо левенштейна? или мне костыли городить с удалением повторяющихся символов?

5 ответов

11 просмотров

Spacy выдаёт схожесть "это был ты" и "эээто был ты...." как 95% и схожесть "это был ты" и "это тильт" как 32%.

Victor Maslov
круто ток у меня не питон

Хм. Тогда тебе прочитать документы на инструмент, которым пользуешься, и найти что-то похожее на указанное в документах Spacy.

Расстояние Дамераю-Хемминга или редакционное расстояние

Victor-Maslov Автор вопроса

вариация на тему https://en.wikipedia.org/wiki/Assignment_problem сработала сразу же как и требовалось https://github.com/Nakilon/nakiircbot/commit/e1f2a59394e7b28a94d5e4614e0f5a1e4fa9e1d5#diff-9cd594d01c6162ac95e06364ef7bdd368079ee77584bdf517b665042dbd62f66R4-R9

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта