tf-idf без дополнительных либ, куда-то все пропало, а были интересные варианты, в том числе с логарифмическим сглаживанием. Помню, Яндекс в свое время перепробовал больше десятка реализаций. @cointegrated ничего такого не попадалось?
Не искал. Я в подобной ситуации писал tf-idf и bm25 сам, благо, алгоритмы очень простые)
Обсуждают сегодня