тексту разметить спаны и каждому привязать некоторый тег (не NER!, много кастомных тегов!). Сейчас пытаюсь поковырять конфиг LabelStudio, но, судя по всему, там такой функциональности нет - нахожу либо простой labeling, либо одно кастомное поле, а мне надо под каждый label такое поле.
1. Можно ли такое намутить через LabelStudio?
2. Есть ли аналогичные инструменты, которые при этом не Prodigy?
@niklub, призываю тебя по пункту (1)
https://brat.nlplab.org/manual.html ?
Ага, вроде он делает то, что нужно. Спасибо 👍🏿
Привет. Может, подойдет что-то в таком стиле? https://labelstud.io/playground/?config=%3CView%20style%3D%22display%3A%20flex%3B%22%3E%3Cbr%3E%20%20%3CView%20style%3D%22width%3A%20150px%3B%20padding-left%3A%202em%3B%20margin-right%3A%202em%3B%20background%3A%20%23f1f1f1%3B%20border-radius%3A%203px%22%3E%3Cbr%3E%20%20%20%20%3CLabels%20name%3D%22ner%22%20toName%3D%22text%22%3E%3Cbr%3E%20%20%20%20%20%20%3CLabel%20value%3D%22Person%22%20%2F%3E%3Cbr%3E%20%20%20%20%20%20%3CLabel%20value%3D%22Organization%22%20%2F%3E%3Cbr%3E%20%20%20%20%3C%2FLabels%3E%3Cbr%3E%20%20%3C%2FView%3E%3Cbr%3E%3Cbr%3E%20%20%3CView%3E%3Cbr%3E%20%20%20%20%3CView%20style%3D%22height%3A%20200px%3B%20overflow-y%3A%20auto%22%3E%3Cbr%3E%20%20%20%20%20%20%3CText%20name%3D%22text%22%20value%3D%22%24text%22%20%2F%3E%3Cbr%3E%20%20%20%20%3C%2FView%3E%3Cbr%3E%3Cbr%3E%20%20%20%20%3CView%3E%3Cbr%3E%20%20%20%20%20%20%3CChoices%20name%3D%22relevance%22%20toName%3D%22text%22%20perRegion%3D%22true%22%3E%3Cbr%3E%20%20%20%20%20%20%09%3CChoice%20value%3D%22Relevant%22%20%2F%3E%3Cbr%3E%20%20%20%20%20%20%20%20%3CChoice%20value%3D%22Non%20Relevant%22%20%2F%3E%3Cbr%3E%20%20%20%20%20%20%3C%2FChoices%3E%3Cbr%3E%3Cbr%3E%20%20%20%20%20%20%3CView%20visibleWhen%3D%22region-selected%22%3E%3Cbr%3E%20%20%20%20%20%20%09%3CHeader%20value%3D%22Your%20confidence%22%20%2F%3E%3Cbr%3E%20%20%20%20%20%20%3C%2FView%3E%3Cbr%3E%20%20%20%20%20%20%3CRating%20name%3D%22confidence%22%20toName%3D%22text%22%20perRegion%3D%22true%22%20%2F%3E%3Cbr%3E%20%20%20%20%3C%2FView%3E%3Cbr%3E%3Cbr%3E%20%20%20%20%3CView%20style%3D%22width%3A%20100%25%3B%20display%3A%20block%22%3E%3Cbr%3E%20%20%20%20%20%20%3CHeader%20value%3D%22Select%20span%20after%20creation%20to%20go%20next%22%2F%3E%3Cbr%3E%20%20%20%20%3C%2FView%3E%3Cbr%3E%20%20%3C%2FView%3E%3Cbr%3E%3Cbr%3E%3C%2FView%3E%3Cbr%3E
Я попробовал, поменял Rating на TextArea, и вышло похоже, спасибо 👍🏿. Три вопроса: 1. Там получается мой Label и TextArea в результатах как равноправные ответы, и результат выглядит как на картинке. Я могу такое сматчить, но нет ли варианта в один ответ это внести? 2. Я сейчас предсказанные теги свернул в одну строку и показываю как ещё один текст, и ручками копирую. Нельзя ли сделать значения Choices или чего похожего с кастомными значениями, чтоб я просто выбирал готовое? (у меня есть список предполагаемых тегов для документа, но не на 100% достоверный) 3. Если я отформатирую свои входные данные как результат LabelStudio, подтянутся ли результаты в редактор как размеченное? Или это копать в сторону интеграции с МЛ алгоритмом?
1. у них одинаковое поле "id" можно матчить по нему 2. а почему собственно <Choices> не подходят? 3. да, можно просто загрузить обратно такие же данные, вот тут больше есть инфы про форматы https://labelstud.io/guide/predictions.html
Choises то подходят, но я не знаю, как в них свои данные запихать. У меня на каждый док есть 2-5 айдишников из большого пула, мне нужно их сматчить со спанами. То есть в идеале интерфейс вида + Предложенный id 1 + Предложенный id 54684 + Предложенный id 2 + Текстовое поле, если все неправильные
Обсуждают сегодня