Насколько это вообще реально осуществить(разметка скажем около 1000 документов)?
Может кто-то уже работал над похожими задачами? У кого-то получалось что-то годное родить?
а разметка чего именно? smartengine может проще купить как вариант... ну или на синтетике учите пайплайн детекция буквы -> ее распознавание -> словарь. со вторым не такая проблема, как с первым конечно.
разметка: сканы трудовой, где отмечено где находится текст и что там написано
хотя smart engines вряд ли для рукопашного текста сойдёт. посмотрите тогда mmocr. там немало. но можно учить свои.
покопаю в эту сторону, спасибо
побуквенная разметка лучше чем по словам?
Обсуждают сегодня