вчерашней теме:
1) если резать на куски с перехлестом, то потом нужно избавиться от bounding box’ов, которые соответствуют одному и тому же тексту. Я знаю про non-maximal suppression. Какие ещё варианты есть?
2) если предположить, что есть достаточно большое количество фотографий в высоком разрешении и в итоге в сеть передаются фотографии в большом разрешении, то что лучше: обучить уже существующие FCN на высокое разрешение или же кропать?
1. nms достаточно стандартный метод 2. обычно то что интересно это размер распознаваемого объекта, соответственно на него и ориентируйся
Обсуждают сегодня