нер-тасков лучше?
Кому сейчас нужен conll-2003? Модель, умеющая только в три сущности, бесполезна в основном. Тут скорее интерес был бы в Oxford-датасете, где 18 типов сущностей. Но, к сожалению, именно там f1 хреновый, и близко не sota.
какую модель порекомендуете тогда для нер файн тюна на английском в основном?
https://huggingface.co/docs/transformers/model_doc/deberta#transformers.DebertaForTokenClassification
спасибо, а почему именно она? Я смотрю, там куча ещё моделей, в том числе и основанных на BERT
Моделей очень много, которые основаны на BERT, также там есть разные версии, которые были обучены на разных датасетах. Я просто помню, что DeBERTa одна из самых новых и лучших сейчас. Можно поискать где-то бенчмарки, где сравниваются разные версии моделей.
Обсуждают сегодня