1) сетка показывает лучшие результаты на изображениях максимально похожих на те, на которых училась. В идеале preprocessing transformation такой же как для обучения, хоть и не обязательно (без трансформа будет работать но может быть хуже детекция) 2) ищете номера? если детекция работает, но ббоксы съехали, то скорее всего где-то рассинхрон между координатами изображения на входе и выходе. Йоло отдает координаты в относительном виде и умножает на ширину/высоту изображения. Если где-то ширина и высота протерялись, можно поэкспериментировать с готовыми координатами (поделить на 640 умножить на реальную ширину изображения или наоборот), хотя это велосипед, и лучше найти причину в трансформе.
Не нужно так учить. Да я тебе больше скажу, что при детекте даже делать нельзя. Я буквально позавчера тестил. Если засовывать туда просто картинку без сохранения пропорций, то качество детекции снижается значительно. Если сохранять пропорции, а свободное место оставлять черным, то качество детекции сильно возрастает
Обсуждают сегодня