для соревнования Kuzushiji Recognition
а затем сходить в этот репозиторий https://github.com/clovaai/CRAFT-pytorch и потом поискать реализации для питорча (они есть на гитхабе) + навернуть сверху простой классификатор для цифр
СRAFT-pytorch как раз примером избыточного я и считаю. В том же проекте я его уже использую как основной инструмент обнаружения регионов с текстом - он обнаруживает слова и текстовые блоки для распознавания через Tesseract. Система для цифр нужна для более точного и быстрого распознавания данных в некотором регионе, для которого подход с Tesseract не дает достаточной точности.
Обсуждают сегодня