но беда в том, что при лемматизации выпадает ошибка (второй скрин). Почему так?
https://stackoverflow.com/questions/27697766/understanding-min-df-and-max-df-in-scikit-countvectorizer Получается что ты удаляешь все слова которые встречаются меньше чем в 5 документах и больше чем в 70 процентах. Посмотри сколько и каких документов на входе получается может там только стоп слова остаются или вообще нет таких слов
Обсуждают сегодня