содержимое текстовых полей для последующей обработки системой OCR. Проблема в том, что использование стандартных подходов CV вроде EAST или грубого определения контуров дают слишком много ложных позитивов и не дают возможности автоматического лейбелинга определяемых зон. Встречался ли кто-нибудь с подобной задачей? Как минимум я ищу что-то для определения текстовых полей, в идеале хотелось бы приблизиться к https://blog.francium.tech/information-extraction-from-id-cards-using-yolov2-e3c846cb3796, но там и так довольно хлипкий механизм обнаружения/разметки.
На эту тему есть хорошее выступление на pyData #6 от ДомКлик
Обсуждают сегодня