Всем привет! Вопрос по тренировке NER: традиционно датасеты формируются таким

образом, что в каждом семпле есть хотя бы одна сущность, норм ли формировать датасет, включающий в себя семплы совсем без сущностей в том числе?

1 ответов

33 просмотра

Не вижу никакой принципиальной проблемы, лишь бы это отвечало предполагаемому сценарию использования (то есть при применении модели тоже будут часто встречаться предложения без сущностей).

Похожие вопросы

Карта сайта