предложения, в которых вообще нет сущностей, как примеры отсутствия, и если нужно, то насколько много?
Нужно, но нельзя, чтобы предложений без сущностей было >X%. X - по дефолту ~50, дальше надо подбирать, тк зависит от сущностей, длины предожений и проекта. Подбирать по результатам на валидации, где есть все предложения без сущностей.
Ага, спасибо. Так и думал, только пропорция интересовала. Но до 50 процентов, это не слишком много? Или таким образом добиваемся большей точности?
Там trade-off будет: сваливание модели в то, чтобы вообще ничего не предсказывать vs высокий false positive.
Я думал, что пропорцию нужно выбирать аналогично данным при эксплуатации модели 👀
Обсуждают сегодня