170 похожих чатов

@Dingdongyouarewrong а у вас есть опыт распознания кирилицы? В перспективе

кирилица тоже нужна, на данный момент распознаю только английские слова

6 ответов

17 просмотров

У меня была задача конкретно распознавания сканов документов, с кириллицей и латиницей вперемешку, и я игрался с настройками движков Paddleocr только на латинице лучше тессеракта на тех документах на 20-30% На кириллице+латинице ситуация наоборот, paddle на процентов 30 хуже, очень часто не отличает кириллицу от латиницы Улучшили общие результаты до приемлемых классические шаги типа бинаризации по определённым правилам, всякие повороты, замена алгоритмов сжатия стандартных, ресэмплинг, разные параметры page segmentation, но, я думаю, вы это и так пробовали

kvdm.dev- Автор вопроса
Dmitry
У меня была задача конкретно распознавания сканов ...

Это я не делал, в этих делах новичек и я программист, не ML инженер.

kvdm.dev
Это я не делал, в этих делах новичек и я программи...

Там суть в том что мы можем передать движку картинку без изменений, а можем ее сначала чуть-чуть подправить препроцессингом Например, прогнать через imagemagick

kvdm.dev- Автор вопроса
Dmitry
У меня была задача конкретно распознавания сканов ...

дообучение paddle на собственных данных дает замечательные результаты :) а по умолчанию модель для кириллицы слабая, да

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта