какому полу обращался человек. Подскажите какие инструменты для этого использовать?
Я попытался при помощи Natasha сделать синтаксический разбор и посчитать какого рода слов больше. Естественно получил неудовлетворительный результат.
Например: «Книга была классная о любви и разлуке. Сам почитай!» - женских слов больше, обращение к мужчине.
Дайте направление - куда копать?
Хм, может сначала посмотреть, а разделяются ли вектора фраз на два кластера?
(есть мнение, что задача сама так себе, и там обязательно будут такие вот подставы) но да, логичней смотреть на род всего, что как-то согласуется с глаголами или местоимения 2 лица (хотя там всё равно может быть шум — обобщённо-личные предложения, цитаты и т.п.)
В данном случае мы понимаем, что фраза обращена к мужчине, по словам "сам почитай", т.к. "почитай" - во втором лице (т.е. это тот человек, к которому обращаются), а слово "сам" мужского рода синтаксически связано с этим "почитай". Думаю, что надо закодить такого рода правила, опирающиеся как на морфологию (узнавание рода и лица), так и на синтаксис (какие слова связаны с какими), а Наташа умеет и то, и другое. Должно получиться умнее, чем просто подсчитывать слова разного рода.
да в смысле у таких штук намноооого больше веса должно быть, чем у каких-то тупо случайных слов
Обсуждают сегодня