на строку.Есть скажем два названия песни и мне нужно чтобы алгоритм понимал что эта песня похожа на эту и ее мы берем.Как это реализовать грамотнее?У меня сейчас сделан алгоритм Левенштейна,который считает чколько пермутаций(шагов) нужно сделать чтобы превратить одну строку в другую и я фильтрую просто количеством процентов схожести,мол если одна строка похожа на другую на 65 процентов то берем ее.Как сделать что-то более оптимальное?
для меня ngram(триграмы) + генерация возможных вариантов + коэфф совпадения хорошо работает https://habr.com/ru/post/114997/
https://www.csharpstar.com/csharp-string-distance-algorithm/
засунуть это в эластик, и дальше разбираться с эластиком, поиск там невероятно мощный
Обсуждают сегодня