Кстати, о плодах трудов этого самого оставшегося без внимания обыкновенного

Question

Кстати, о плодах трудов этого самого оставшегося без внимания обыкновенного

интеллекта ...

Посоветуйте пожалуйста.

Есть большое количество сканов документов и копий этих документов. Есть желание отделить первое от второго. Отличие в том, что на копиях стоит штамп. Место и ориентация штампа могут быть сильно разные. Качество сканов тоже сильно разное. Имеет смысл пытаться решить задачу средствами opencv?
На рисунке — образец штампа.

#database #opencv #russian

0

12.10.2023

7 ответов

48 просмотров

Alex

Если кроме таких штампов на документах больше синего нет, то переводите в HSV, далее inRange и считайте число ненулевых пикселей. В зависимости от результата будет понятно есть штамп или нет.

0

12.10.2023

Alexander Morozov Автор вопроса

Alex
Если кроме таких штампов на документах больше сине...

Спасибо! Увы. Часть сканов черно-белая. С другой стороны — наличие на скане ТОЛЬКО синего цвета будет отличным признаком для отсеивания цветных сканов с черно-белых копий. А такие есть!

0

12.10.2023

Alex

Alexander Morozov
Спасибо! Увы. Часть сканов черно-белая. С другой с...

еще есть вариант с морфологией, если надпись штампа "копия верна" самая жирная в документах.

0

12.10.2023

Alexander Morozov Автор вопроса

Alex
еще есть вариант с морфологией, если надпись штамп...

Можете подсказать ключевые слова для гугления?

0

12.10.2023

Alex

Alexander Morozov
Можете подсказать ключевые слова для гугления?

Морфологическая реконструкция. Эрозией можно затереть все тонкие элементы и результат будет маркером при реконструкции, а маской исходное изображение. Я так (давно правда было) выделял название научных статей в сканах, распознавал только его и переименовывал в соответствии с ним pdf-ки пакетно.

0

12.10.2023

Alexander Morozov Автор вопроса

Alex
Морфологическая реконструкция. Эрозией можно зате...

Хочу поблагодарить за совет. Правда я решил вопрос несколько иначе (вообще без opencv). 1) Снизил разрешение в 5 раз. 2) Разделил на цветовые компоненты. 3) Распознал текст tesseracact. Получилось неидеально, но все равно очень хорошо.

0

19.10.2023

алексей панчук · Accepted Answer

алексей панчук

найти через сетку данный штамп и потом делать ранжирование. штамп можно обучить на той-же yolo, мы такое делали, решение работало точно.

0

12.10.2023

16 похожих чатов

Кстати, о плодах трудов этого самого оставшегося без внимания обыкновенного

7 ответов

Похожие вопросы