реализовать нативный байосовский классификатор спама.
Немного подробностей: вводится 3 текста. Спам. Не спам. Проверочное.
На анализе 2-х текстов определяется судьба третьего.
И вот главное что это для русского языка и одно слово в разных формах является одним словом.
Как можно определить, что это слово является собой, но в другой форме?
ии никак иначе и учить его нужно будет долго и упорно либо заюзать яндексовские услуги
Скорее всего вам нужно найти готовые сеты с такими данными
Попробовать разобрать его (слово). Отделить корень от суффикса и окончания Есть исключения, но вообще суффиксов и окончаний в русском языке ограниченное количество
Обсуждают сегодня