Доброго вечера. Хотелось бы попросить рекомендации инструмента: не попадались ли

Question

Big Data Science :: AI / Big Data / Machine Learning / MLOps

Доброго вечера. Хотелось бы попросить рекомендации инструмента: не попадались ли

вам опенсорсные системы для распознавания рукописного русского текста или для распознавания рукописного английского текста с возможностью переобучения? Интересует обработка курсивного текста в первую очередь, с отдельнымми рукописными буквами работать в принципе на основе EMNIST уже можно.

#database #programming #russian #software

0

28.02.2021

7 ответов

38 просмотров

Vlad

Возможно tesseract ocr вам подойдёт. С последней 4 версией я не работал, но предыдущая версия печатный чек вполне неплохо распознавала. И насколько я помню, можно дообучить своему шрифту, если нужно

0

01.03.2021

Ilya

Я использовал для подобной задачи: https://github.com/clovaai/deep-text-recognition-benchmark Но нужны слова с лейбелами. Буквы выучит легко, но на основе этого не научится читать, а только распозновать отдельные буквы.

0

01.03.2021

Ilya

Ilya
Я использовал для подобной задачи: https://github....

Если кстати есть задача выучить именно один почерк, то весьма выполнима на этой модели. С обобщением для любого почерка гораздо сложнее.

0

01.03.2021

Sergey Автор вопроса

Vlad
Возможно tesseract ocr вам подойдёт. С последней 4...

Tesseract c дообучением я использовал уже, но работает он только для печатного текста. Рукописный курсив не распознается принципиально.

0

01.03.2021

Sergey Автор вопроса

𝕽𝖔𝖒𝖆𝖓 𝕯𝖊𝖗 𝕻𝖔𝖌𝖗𝖔𝖒𝖎𝖘𝖙
в принципе, такое и самому несложно набросать. сам...

Спасибо, попробую работать над комбинациями шрифтов. Проблема будет в генерации синтетического курсива, сейчас мне совсем непонятно, как задать принципы соединения букв.

0

01.03.2021

𝕽𝖔𝖒𝖆𝖓 𝕯𝖊𝖗 𝕻𝖔𝖌𝖗𝖔𝖒𝖎𝖘𝖙

Sergey
Спасибо, попробую работать над комбинациями шрифто...

А никак. Нет универсального решения...

0

03.03.2021

𝕽𝖔𝖒𝖆𝖓 𝕯𝖊𝖗 𝕻𝖔𝖌𝖗𝖔𝖒𝖎𝖘𝖙 · Accepted Answer

в принципе, такое и самому несложно набросать. самый большой гемор - этап "обучения распознавалки". У меня буквы в школьных и институтских конспектах очень отличаются. как вариант - взять кучу шрифтов и их растровые и/или векторные координаты за основу брать. но, все равно, все не учтешь. Меня эта тема зацепила после инсульта. Ни одна библа не могла сопоставить мой почерк "до" и каракули "после". Человек распознает, программа - нет.

215 похожих чатов

Доброго вечера. Хотелось бы попросить рекомендации инструмента: не попадались ли

7 ответов

Похожие вопросы