возник вопрос по лейблам которые они юзают в своей нейронке. Там встречаются лейблы вроде B-ARG0 или I-ARG1. Что означают вторые компоненты типа ARG0, ARG1, ARG2 или ARGM я разобрался, даже нашел список с описаниями для них и для всех типов ARGM. Но я не могу понять что означает первая компонента - которая принимает значение "I" или "B". Вот и вопрос к вам, может кто в курсе что эти две буквы означают в лейблах маркировки семантических ролей?
B-Х - это начало тега Х (первый токен в нем), а I-X - это второй и все последующие токены в этом теге. Это нужно, чтобы уметь размечать границы нескольких сущностей с одним и тем же тегом подряд. Для примера фраза в[О] москве[B-geo] нижнем[B-geo] новгороде[I-geo] казани[B-geo] и[O] санкт[B-geo] петербурге[I-geo] префикс I показывает, что помеченное им слово - не новый топоним, а продолжение предыдущего топонима. Можно нагуглить подробности по запросу типа "IOB markup".
Обсуждают сегодня