схожесть двух текстов (для исключения нечетких дублей) ?
схожесть в смысле в процентах?
Эластик даёт оценку схожести результата к запросу
Blevesearch вроде что-то такое мог
Расстояние Ливенштейна не пойдёт?
Нужно же сравнивать именно тексты, а не запрос к тексту. Нужно разбивать текст на шинглы и все такое
Тестил пару либ на го но банальный пробел в середине фразы все может испортить. Наверное надо текст очищать но я забил
Обсуждают сегодня