текстовых фич (кол-во слов, символов, средняя длина слова, % уникальных слов в тексте и тп)?
Мигрирую из R и еще не знаком со всеми библиотеками
nltk
А в каком модуле в NLTK не подскажете?
Простите, WordPunctTokenizer; FreqDist
Обсуждают сегодня