Здравствуйте, подскажите пожалуйста, мне такую задачку предложили: есть произведение автора

Question

Здравствуйте, подскажите пожалуйста, мне такую задачку предложили: есть произведение автора

и фанфики по нему, которые пишут уже другие люди. Придумать метрику сравнения фанфиков, чтобы выяснить схожесть с произведением, которым люди вдохновились. Пока из самого очевидного подсчет количества восклицательных знаков, частей речи. А что можно еще рассмотреть?

#nlp #programming #russian

0

10.04.2022

4 ответов

27 просмотров

Nikolay Karelin

Для начала желательно определиться, что значит "схожесть": если по стилю, тогда стилометрия, как уже подсказали. Если по "смыслу" (имена персонажей, локации, темы общения и пр.), то можно попробовать любые семантические методы, TF-IDF, WDM, document embeddings, ...

0

10.04.2022

Ali

Если всё-таки стилометрия, то есть ещё Stylo (на языке R). С графическим интерфейсом

0

10.04.2022

Sergey Ustyantsev

Сделать синтаксический разбор, сравнить статистики по синтаксическим группам.

0

10.04.2022

gisly gisly · Accepted Answer

gisly gisly

Здравствуйте! Может быть, повторить описанное в этом тьюториале: https://programminghistorian.org/en/lessons/introduction-to-stylometry-with-python ?

0

10.04.2022

170 похожих чатов

Здравствуйте, подскажите пожалуйста, мне такую задачку предложили: есть произведение автора

4 ответов

Похожие вопросы