170 похожих чатов

Здрасьте Есть документ (картинка с документом). Нужно вырезать определенные поля и

вытащить текст с полученных изображений.

Порядок, думаю, такой будет:
1. Найти документ и обрезать изображение чтобы на нем был только сам документ.
2. Натренировать нейронку на поиск locations определенных зон.
3. Натренировать НС на разбив полученных изображений на буквы.
4. Натренировать НС на определение букв (готовые рещения дают плохой рез-тат на данном шрифте)

Проблемы:
1. не нашел инструмент для обрезки изображения (нахождения локаций), чтобы осталося только документ и убралось все лишнее.
2. Разбив документа на локации (поля) (похоже на первую проблему)
3, 4 - уже могу сам решить

Подскажите плиз инструменты для решения первой и второй проблемы.
Возможно кто-то сталкивался с похожей задачей и мб есть другой подход к ее решению?
Спасибо

1 ответов

9 просмотров

Pillow + tesseract ocr

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
в JclConsole объявлено так: function CtrlHandler(CtrlType: DWORD): BOOL; stdcall; - где ваше объявление с stdcall? у вас на картинке нет stdcall
Karagy
8
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Карта сайта