видео?
Смотря что понимается под распознаванием
обведение объект в рамку и вывод probability этого объекта.
Ну регрессия на координаты и кроссэнтропия на класс тогда
Я не знаю изначальные координаты и классы. Например я хочу сравнить 2 нейронки на одном видео. Я смог вывести только следующие: (Средняя точность распознавания в видео) * (Количество распознанных объектов) (0.552 * 4100) например. Можно еще привести к числу от 0 до 1. Конечно, эта метрика не учитывает ложные срабатывания, и возможно еще чего-то..
Если ты не знаешь где у тебя объекты то начни с разметки данных)
если влом размечать данные - смотри временную стабильность чтобы на соседних кадрах обьект был близко
Получишь константный предикт
режь кадры случайно, чтобы нейронка не знала где "то же место"
Без размеченных данных тут делать нечего. Может и есть методы, которые позволят вам получить метрику, коррелирующую с адекватными метриками, использующими разметку, но проще будет разметить хотя бы 1-2 видео.
Обсуждают сегодня