вытащить текст с полученных изображений.
Порядок, думаю, такой будет:
1. Найти документ и обрезать изображение чтобы на нем был только сам документ.
2. Натренировать нейронку на поиск locations определенных зон.
3. Натренировать НС на разбив полученных изображений на буквы.
4. Натренировать НС на определение букв (готовые рещения дают плохой рез-тат на данном шрифте)
Проблемы:
1. не нашел инструмент для обрезки изображения (нахождения локаций), чтобы осталося только документ и убралось все лишнее.
2. Разбив документа на локации (поля) (похоже на первую проблему)
3, 4 - уже могу сам решить
Подскажите плиз инструменты для решения первой и второй проблемы.
Возможно кто-то сталкивался с похожей задачей и мб есть другой подход к ее решению?
Спасибо
Pillow + tesseract ocr
Обсуждают сегодня