любительских паделок
юзай тессеракт хоть через командную строку, норм работает Как я понял из писания ironOCR, он и базируется на основе него, но типа улучшен (в плане кач-ва распознавания). Сомневаюсь, что именно распознавание прям кардинально улучшено (если бы было так, то это был бы уже не тессеракт)
я пробовал, но видимо не совсем в фильтрах разобрался, плохой результат получается. надо будет попробовать вникнуть в тему.
В свое время делал на основе файнридера У него есть функционал watched folder (или hot folder), закидываешь в "in" любой поддерживаемый формат, ждёшь распознанный текст в "out" (или "error") Видел автоматизацию и на предприятиях на основе такого подхода. Уж у кого цена на библиотеки высокие — так это у Abbyy. Но и кач-во у них лучшее, пожалуй.
Обсуждают сегодня