пыталась решить задачу с помощью разметки и тренировки layout-parser. Но при том что разметили около1500 качество все равно так себе
Подскажите, пожалуйста, какие вообще варианты есть?
(Работаю с резюме, где может быть разный layout).
PaddleOCR слышала про него, но не пробовала, смущает другой фреймворк и описания на китайском, но можно будет попробовать, спасибо огромное!
Он хорошо работает и быстро, только OCR на русском хромает, в предобученных не было цифр + сегментатор кропит bbox-ы слишком плотно к границе символов, в общем много шума на выходе, но в вашей задаче он реально подойдёт.
он работает и его даже можно дообучать
Обсуждают сегодня