реализовать нативный байосовский классификатор спама.
                  
                  
                  
                  
                  
                  Немного подробностей: вводится 3 текста. Спам. Не спам. Проверочное.
                  
                  
                  На анализе 2-х текстов определяется судьба третьего.
                  
                  
                  
                  
                  
                  И вот главное что это для русского языка и одно слово в разных формах является одним словом.
                  
                  
                  
                  
                  
                  Как можно определить, что это слово является собой, но в другой форме?
                  
                  
                
ии никак иначе и учить его нужно будет долго и упорно либо заюзать яндексовские услуги
Скорее всего вам нужно найти готовые сеты с такими данными
Попробовать разобрать его (слово). Отделить корень от суффикса и окончания Есть исключения, но вообще суффиксов и окончаний в русском языке ограниченное количество
Обсуждают сегодня