DeepPavlov для английского языка в некоторых случаях разметку начинает с тэга I, а не B? Например, Republic (I-GPE) Moldova (B-GPE); Ukrainian (I-ORG); Parliament (I-ORG).
Потому что, чаще встречается Banana Republic и Parliament of Honduras
Хм.. Как же тогда склеивать такие сущности?
Вообще, обычно такие вещи решались при помощи CRF
Можешь пояснить, пожалуйста?
Это такая моделька, которая выучивает, что после O никогда не идет I-XXX и корректирует выход нейронки. SOTA модели NER на LSTM обычно заканчивались CRF.
Обсуждают сегодня