Интересно. Я правильно понимаю, что при добавлении документа не нужно

Question

пересчитывать хеши остальных документов, в отличие от TF-IDF, где нужно будет пересчитать весь индекс?

0

23.12.2017

48 просмотров

Dmitriy Kuts · Accepted Answer

tf-idf это вообще не про похожесть обычно. все равно надо пересчитывать новую статью со всеми предыдущими. в этом и "сложность" алгоритма

0

23.12.2017