и соответствующие им аттрибуты. Симптомов много (больше 300, набор атрибутов может отличаться для них)
у нас на работе есть сейчас работающая система на yargy-правилах.
Поддерживать ее с течением времени все сложнее + измерять качество работы парсера проблематично, я решил переделать всё на pipeline из классификатора интентов и NER (+ наверно еще нужно будет relation extraction добавлять)
знаю что в yargy можно добавить Tagger, чтобы сделать разметку текстов на основе существующих правил.
Подскажите, правильно ли я описал последовательность действий, или что-то упустил?
Также, в перспективе наверно хотелось бы чтобы система могла работать с графом знаний (симптомы-атрибуты-болезни), но тут у меня есть пробелы в знаниях. Если подскажите вариант архитектуры буду признателен))
Посмотрите, возможно, это ваш случай https://www.kaggle.com/c/nbme-score-clinical-patient-notes/submissions
Обсуждают сегодня