@Dingdongyouarewrong а у вас есть опыт распознания кирилицы? В перспективе

Question

Natural Language Processing

kvdm.dev

@Dingdongyouarewrong а у вас есть опыт распознания кирилицы? В перспективе

кирилица тоже нужна, на данный момент распознаю только английские слова

#nlp #programming #russian

0

22.05.2023

6 ответов

40 просмотров

kvdm.dev Автор вопроса

Dmitry
У меня была задача конкретно распознавания сканов ...

Это я не делал, в этих делах новичек и я программист, не ML инженер.

0

22.05.2023

Dmitry

kvdm.dev
Это я не делал, в этих делах новичек и я программи...

Там суть в том что мы можем передать движку картинку без изменений, а можем ее сначала чуть-чуть подправить препроцессингом Например, прогнать через imagemagick

0

22.05.2023

Konstantin Galagan

kvdm.dev
Это я не делал, в этих делах новичек и я программи...

Лиха беда начала )))

0

22.05.2023

kvdm.dev Автор вопроса

Dmitry
Там суть в том что мы можем передать движку картин...

Вот я как раз это и ищу

0

22.05.2023

Vladimir Grigoryev

Dmitry
У меня была задача конкретно распознавания сканов ...

дообучение paddle на собственных данных дает замечательные результаты :) а по умолчанию модель для кириллицы слабая, да

0

22.05.2023

Dmitry · Accepted Answer

У меня была задача конкретно распознавания сканов документов, с кириллицей и латиницей вперемешку, и я игрался с настройками движков Paddleocr только на латинице лучше тессеракта на тех документах на 20-30% На кириллице+латинице ситуация наоборот, paddle на процентов 30 хуже, очень часто не отличает кириллицу от латиницы Улучшили общие результаты до приемлемых классические шаги типа бинаризации по определённым правилам, всякие повороты, замена алгоритмов сжатия стандартных, ресэмплинг, разные параметры page segmentation, но, я думаю, вы это и так пробовали

170 похожих чатов

@Dingdongyouarewrong а у вас есть опыт распознания кирилицы? В перспективе

6 ответов

Похожие вопросы