типичные, связанные с отношением к должностному лицу) и контекст их употребления (позитивный, негативный, нейтральный), далее проверить наличие этих сущностей во всех текстах и построить матрицу (строка - текст, столбец - сущность, ячейка - факт наличия или отсутствия сущности в тексте, записанная как 1-положит контекст появления, 0 - нейтральный, -1 - отрицательный, пустая - если не встречается). Понимаю, что не совсем адекватно объяснил, но может у кого-то есть мысли по этому поводу?
Имеет смысл в качестве предобработки перед использованием NER выполнить разрешение кореферентности. Например, "Председатель Правительства РФ в среду вечером в эфире программы Время положительно отозвался о действиях Эльвиры Набиуллиной. При этом он подчеркнул, что действия главы Центробанка эффективны и направлены на борьбу с кризисом. Однако приглашенный эксперт программы Никита Ярцев критически отнесся к ее решениям, отметив, что они разрушают экономику". На сыром тексте у вас будет только одно извлечение сущности "Ирина Набиуллина". После разрешения кореферентности будет текст: "Председатель Правительства РФ в среду вечером в эфире программы Время положительно отозвался о действиях Эльвиры Набиуллиной. При этом он подчеркнул, что действия Эльвиры Набиуллиной эффективны и направлены на борьбу с кризисом. Однако приглашенный эксперт программы Никита Ярцев критически отнесся к решениям Эльвиры Набиуллиной, отметив, что они разрушают экономику"
Обсуждают сегодня