и фанфики по нему, которые пишут уже другие люди. Придумать метрику сравнения фанфиков, чтобы выяснить схожесть с произведением, которым люди вдохновились. Пока из самого очевидного подсчет количества восклицательных знаков, частей речи. А что можно еще рассмотреть?
Здравствуйте! Может быть, повторить описанное в этом тьюториале: https://programminghistorian.org/en/lessons/introduction-to-stylometry-with-python ?
Для начала желательно определиться, что значит "схожесть": если по стилю, тогда стилометрия, как уже подсказали. Если по "смыслу" (имена персонажей, локации, темы общения и пр.), то можно попробовать любые семантические методы, TF-IDF, WDM, document embeddings, ...
Если всё-таки стилометрия, то есть ещё Stylo (на языке R). С графическим интерфейсом
Сделать синтаксический разбор, сравнить статистики по синтаксическим группам.
Обсуждают сегодня