естественного языка. Типа Person, Emotions, Time, Space, etc.?
Насколько мне известно, нет. Самым распространённым форматом является формат из датасета conllu 2003, в литературе к этому формату обычно отсылаются как "CoNLL-U format" или "conll-style".
IMHO, не совсем верно пытаться брать какие-то абстрактные семантические понятия и пытаться использовать их для анализа естественного языка. Язык формирует эти самые понятия, а не наоборот. У какого-то племени мумба-юмба вполне себе может отсутсвовать понятие времени.
AFAIK, "CoNLL-U format" - это просто формат сериализации синтаксических деревьев, принятый у лингвистов. О наличии XML, JSON и т.д. они просто не догадываются …
это разные "форматы" например, json формат файла, а формат структуры в нём может быть rasa
лингвисты не догадываются??? conll придумывали комплингвисты вообще-то, вот не придумывайте, пожалуйста, и не начинайте тут разводить высокомерное нечто. и да, для ряда задач эти ваши джейсоны не помогают, любому аннотатору в табличку глазами всё равно удобнее смотреть
да вроде conll во что угодно потом можно завернуть, это ж просто описание необходимых полей, их содержания и форматп
Обсуждают сегодня