Коллеги, проясните такую вещь. Есть например Бенчмарки для NER моделей.

Question

Коллеги, проясните такую вещь. Есть например Бенчмарки для NER моделей.

Я правильно понимаю что это размеченный датасет на котором каждый может запустить свою модель и посмотреть качество и сравнить себя с другими моделями? Например с текущим sota решением. Данные датасеты закрытые? Мне думается что нет, но как тогда исключать тех кто добавил этот датасет в обучение?

#nlp #programming #russian

0

06.06.2023

13 ответов

42 просмотра

Yuriy Nazarov

Так а зачем кому-то учиться на тесте и получать завышенный скор?

0

06.06.2023

Alexander Автор вопроса

Yuriy Nazarov
Так а зачем кому-то учиться на тесте и получать за...

Что-бы например хайпануть и привлечь внимание, а вы разбирайтесь, модель хорошая или я жулик

0

06.06.2023

Alexander Автор вопроса

Ноунейм готов к этому. Не верится что все держится на честном слове(

0

06.06.2023

Yuriy Nazarov

Alexander
Ноунейм готов к этому. Не верится что все держится...

Если речь про соревнования, то там тест скрывают. Либо только лейблы. Либо даже примеры, требуя сабмитить систему, которая делает предсказания.

0

06.06.2023

Alexander Автор вопроса

Yuriy Nazarov
Если речь про соревнования, то там тест скрывают. ...

Не соревнования, а бенчмарки, которые например указывают в статьях на архиве

0

06.06.2023

vvv

Alexander
Что-бы например хайпануть и привлечь внимание, а в...

вот недавно выпустили статью, в которой опровергают заявление о сдаче GPTшкой экзамена для юристов лучше 95% людей (цифры в блоге OpenAI) в реальности, утверждают в статье, она всего лишь лучше 40-70%

0

06.06.2023

vvv

vvv
вот недавно выпустили статью, в которой опровергаю...

цифры примерные, степень отличия вроде сохранил

0

06.06.2023

Ilya Gusev

vvv
вот недавно выпустили статью, в которой опровергаю...

там всё сложнее всё-таки: - gpt-4 деградирует с момента релиза из-за закручивания гаек - цифры перцентилей за разные годы

0

06.06.2023

Rinat Abdullin

Ilya Gusev
там всё сложнее всё-таки: - gpt-4 деградирует с мо...

GPT4 модель за API не меняли с момента релиза с марта. В чем именно выражается деградация, можно спросить?

0

06.06.2023

Ilya Gusev

Rinat Abdullin
GPT4 модель за API не меняли с момента релиза с ма...

https://youtu.be/qbIk7-JPB2c?t=1572 веб версия менялась неоднократно про api точно неправда, прямо сейчас есть gpt-4 и gpt-4-0314

0

06.06.2023

Rinat Abdullin

Ilya Gusev
https://youtu.be/qbIk7-JPB2c?t=1572 веб версия мен...

Да, web версия - это ChatGPT, отдельный продукт для людей. Он развивается. Но API для интеграции они не трогали. GPT-4 сейчас указывает на GPT-4-03xx. Это как с тегами в докере. С марта оно не менялось, было официальное подтверждение от OpenAI. Это ещё долго на HN обсуждали))

0

06.06.2023

Ilya Gusev

Rinat Abdullin
Да, web версия - это ChatGPT, отдельный продукт дл...

да, я ошибся, gpt-4 и gpt-4-0314 действительно одно и то же

0

06.06.2023

Konstantin Galagan · Accepted Answer

Konstantin Galagan

А зачем делать замеры на ванильных датасетах? Сделайте свой датасет, со своими приколами и сделайте оценку, насколько правильно модель отловит сущности

0

06.06.2023

170 похожих чатов

Коллеги, проясните такую вещь. Есть например Бенчмарки для NER моделей.

13 ответов

Похожие вопросы