в тексте? (Возможно есть предобученная моделька в такой NER домен)
Задача из универа, имеются проекты с вакансиями и требованиями в них. Нужно по этим вакансиям подобрать релевантную команду - руководителя-преподавателя и студентов. По преподавателю можем насобирать информацию какие курсы он ведет, какие области интересов и тд, по студенту тоже можем насобирать информацию о его учебных курсах, в каких проектах он до этого участвовал, какие задачи делал и тд. Кажется, что задача двухуровневая - сначала выделить из всей информации теги (навыки и интересы) как у преподавателей так и у студентов, а потом сделать матчинг выделенных тегов на теги требуемых навыков в вакансиях проекта и подобрать наиболее релевантных людей на проект. Или может быть есть какой-то другой подход к решению задачи?
если в требованиях к точности нет необходимости показывать конкретные навыки, то вариант с GPT3, 4, где при помощи промтов будет строиться список фраз-описаний предметной области, вполне годится. Второй этап - поиск по эмбедингам по резюме с использованием этих фраз. Если надо показывать совпадение по конкретным навыкам, то да, нужен NER + словарь для нормализации + что-то с фасетным поиском типа Elastic/OpenSearch. Словарь на английском языке можно взять например здесь https://www.onetcenter.org/database.html#individual-files
хорошие идеи, спасибо!
У меня коллега диссер для подобной задачи написал, если интересно, пишите в личку, поделюсь контактом
можно попробовать https://hitz-zentroa.github.io/GoLLIE/
посмотрю, спасибо!
в принципе выше описали, - да в принципе делается поисковой pipeline + NER (необязательно даже промтинг) по скиллам я видел когда-то подобное - https://github.com/AnasAito/SkillNER (не использовал никогда и даже не смотрел внутрь, но подозреваю там какой-нибудь weak supervision+spacy)
Спасибо, да тоже вчера на этот инструмент наткнулся
Обсуждают сегодня