очищенный текст(lower, stem, etc) в dataframe. Использую TfidfVectorizer чтобы превратить текст в цифры и закинуть в байевский классификатор. Работает без проблем на сплите трейн и тест. Но когда я пытаюсь классифицировать текст из другого сайта пройдя ровно те же препроцессы, у меня .predict выдает ни один класс, как у меня было в трейн-тест сплите, а 700, при параметре в TfidfVectorizer(max_features=700). Может кто-нибудь показать где у меня неправильно?
а ты выбирай среди них тот, у которого предсказание максимальное
Обсуждают сегодня