и различных вариантов написания? Для NER и словосочетаний. Например: Russia, Russian Federation, RF, Rossiya и тд. Как внутри документа, так и между ними. Нужно учесть, что могут встретиться однофамильцы или одно наименование может быть у персоны и организации.
Для NER эта задача называется entity linking, и обычно она решается через привязку сущности к элементу wikidata или ещё какого-то графа знаний. Есть готовые решения, например, https://github.com/egerber/spaCy-entity-linker.
Обсуждают сегодня