пересчитывать хеши остальных документов, в отличие от TF-IDF, где нужно будет пересчитать весь индекс?
tf-idf это вообще не про похожесть обычно. все равно надо пересчитывать новую статью со всеми предыдущими. в этом и "сложность" алгоритма
Обсуждают сегодня