Привет, есть спарсенные 1к статей(текст), я их очистил и закинул

Question

Привет, есть спарсенные 1к статей(текст), я их очистил и закинул

очищенный текст(lower, stem, etc) в dataframe. Использую TfidfVectorizer чтобы превратить текст в цифры и закинуть в байевский классификатор. Работает без проблем на сплите трейн и тест. Но когда я пытаюсь классифицировать текст из другого сайта пройдя ровно те же препроцессы, у меня .predict выдает ни один класс, как у меня было в трейн-тест сплите, а 700, при параметре в TfidfVectorizer(max_features=700). Может кто-нибудь показать где у меня неправильно?

#backend #programming #python #russian

0

20.06.2018

1 ответов

33 просмотра

Aragaer · Accepted Answer

Aragaer

а ты выбирай среди них тот, у которого предсказание максимальное

0

20.06.2018

170 похожих чатов

Привет, есть спарсенные 1к статей(текст), я их очистил и закинул

1 ответов

Похожие вопросы