какие, быть может, есть готовые решения для решения следующего типа задачи.
Есть картинки одинакового размера человеческими лицами или котиками, не суть важно. На каждый целевой объект (лицо человека или морда котика) есть, допустим, по 5 изображений с разных ракурсов. Всего объектов может быть десятки-сотни тысяч. Вопрос: что нужно юзать, чтобы по новой картинке, которую модель ещё не видела, можно было отыскать объет, изображенный на ней ? Ну или выдавать топ N самых похожих объектов ?
Понятное дело, что все картинки надо преобразовать в векторы, но вот какую дальше модель использовать для поиска? С одной стороны, можно было бы попробовать использовать классический подход типа вот этого: https://www.tensorflow.org/tutorials/keras/classification , но в подобного рода датасетах есть много примеров и мало классов, а у меня ситуация обратная и, думаю, данный подход не подойдет.
ReID?
да, похоже на то. Думаю ведь модели будет без разницы кто на картинках при таком подходе? Я имею в виду, люди, животные или ещё что-то
да, если новые данные не OOD (что значит что были похожие данные в обучающей выборке)
OOD = out of date ? =)
out of distribution
ок. ну да
Если много объектов и мало обучающих картинок, то рой в сторону сиамских сетей
Тебе обычная классификация нужна или нужно определять морду котика или человека? Т.е. фактически идентификация?
идентификация, по сути не важно кого
Обсуждают сегодня