170 похожих чатов

На русском -- тематические дорожки на Dialog: http://www.dialog-21.ru/evaluation/2020/disambiguation/rurebus/ и http://www.dialog-21.ru/evaluation/2020/disambiguation/taxonomia/ и http://www.dialog-21.ru/evaluation/2016/ner/ На английском

-- кроме соревнований по семантике, можно искать статьи про крупные базы, вокруг которых всё строится: Google Knowledge graph , wikidata и common sense database ( конкретнее, были ConceptNet и Babel ) .
А вот скажем по NER конкретно:
Ищем "NER datasets", https://paperswithcode.com/datasets?task=named-entity-recognition-ner&page=1 , оттуда идём на benchmarks и смотрим на работы.
Или по SRL: https://paperswithcode.com/sota/semantic-role-labeling-on-ontonotes .
https://en.m.wikipedia.org/wiki/Commonsense_reasoning перечисляет некоторые проекты в этой области.
Что касается извлечения с хорошим качеством -- целый комбайн надо поднимать (предобработка, разрешение анафоры, синтаксиса и NER, потом только извлекать связи), я помню что allennlp этим занимался именно как комбайном. Neuralcoref тут библиотека, на которую всё ссылались.
И я бы не гнался за топом по F1, потому что даже у рекордсменов F1=0.7 -- это очень плохо для любого практического использования. Это значит, что система загребла с полезными отношениями кучу мусора (precision=0.7 recall=0.7 это "треть берём лишних и треть правильных не находим"). В такой ситуации могут быть полезны более правильные расширяемые концептуальные решения, например, низкие по полноте или по точности, но те, что после доводки на конкретном домене будут хорошо решать конкретную задачу, раз уж в общем виде пока задача нормально не решается.
И вот конкретно секция
https://paperswithcode.com/task/relation-extraction

1 ответов

18 просмотров

Добрый день, Юрий! Интересная статья "R-BERT для извлечения отношений". Результат по ВИЕ - 0,44 (F-балл). Наверно, это самый высокий на сегодняшний день (для русского языка). Согласен, что, в целом, необходим комбайн: 1) задача NER, 2) задача RE. Вопрос реализации) Наверно, только практика поможет и перебор вариантов. Наверно, скомкано написал) Было бы интересно обсудить практику реализации Планируем заняться подобной задачей

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
Коллеги, доброе утро. Запустил на удаленном хосте приложение (ручками зашел туда по ssh и запустил, не командой удаленно). Создал потом ssh-туннель, и с моей машины приложение...
Δημήτηρ
9
Карта сайта