типа красный нос, еркая шандра, глюкая куздра ..(т.е. то, что похоже на прилагательное + существительное)?
так понимаю юзать tokenizer не подходит так как он работает в пространстве целых слов.
Значит нужно работать в пространстве букв.
Как превратить НС в преобразование вида: предложение -> предложение?
PS: понятно, что можно не использовать НС, а использовать какие-нибудь регулярки. Вопрос можно ли с помощью НС извлекать что-то(сочетание) примерно похожее на, что-то другое(сочетание прил+сущ) но заранее точно не известное
https://spacy.io/usage/rule-based-matching#_title Можно составить правило на основе частей речи. Part-of-Speech Tagging?
http://nlpprogress.com/english/part-of-speech_tagging.html
тут хватит питона и pymorphy2
Конечно можно. Надо текст сначала на слова разделить, потом слова на буквы. Обучить что сущ+прил - 1. Обычный автоэнкодер должен справиться. А вообще правильно сказано - использовать библиотеку pymorphy
Обсуждают сегодня