работы с лигал доменом? Классификация (few shot), NER (zero-shot/few-shot), матчинг сущностей в документах.
Для медицины вон сколько, BioGPT, MedPaLM, может подобные есть и для юридических документов?
Если английский, то legalbert, для русского rugpt-3 обучалась на 40 GB законодательства и судебки.
спасибо! Лигалберт нашел, но он какой-то старенький, ну и тем более не кладется в парадигму zero/few шотов, насколько я понимаю
Для английского есть датасеты edgar с миллионами контрактов, возможно llama и alpaca будут нормально работать в этом домене. Точно тестировали gpt 3.5 там все хорошо было
а где что тестировали, можешь пж ссылкой поделиться? 👀
Ничего не публиковали, был legaltech стартап.
Обсуждают сегодня