экрана в которой находится объект. Всего, как вы можете заметить, их 4. Я понимаю, что это задача классификации, но как для нее должен выглядеть датасет - не имею понятия. Не могли бы вы что-нибудь мне посоветовать?
Что есть объект? Что мы про него знаем?
Если объект будет сразу на 2 частях, то будет сложно определить. Придется много свего придумывать. Я тоже об этом думал
Есть куча специальных датасетов и моделей для object detection. Погуглите. Обычно они предсказывают bounding box - прямоугольник, заключающий в себя объект. По координатам уголков этого bounding box'а можно тривиально вычислить, в какой (или в каких) части экрана он находится.
yolo?
Обсуждают сегодня