монеты на весь кадр. Надо найти область которой они отличаются друг от друга. Насколько я понимаю, это классический CV. Нашёл круг с помощью Hough circle. Удалил фон монеты. После усреднил гистограмму и нашёл canny. После смотрю где самый большой STD. Проблема в том, что монеты не идеально отцентрованны. Соответственно, происходят лишние шумы. Что стоит делать? Пока есть идеи делать feature matching и накладывать монеты по features друг на друга... Есть идеи или мб уже готовое решение?
Так, я пропустил, ты, в итоге, разобрался с этой задачей? В кратце можешь основные этапы/идеи рассказать? Можно в лс
Привет, я в итоге ещё не написал решение буду ли я заниматься проектом, ибо данных слишком мало для сети, а не сетью никак не получалось. Был план, что нахожу монету с помощью hough circle, после поворачиваю с помощью fourier-merlin, после нахожу фичи с помощью sift. Но что я только не пробовал, везде капец. После был проект, который надо быстро сделать, может быть на этой недели ещё раз посмотрю, ибо задача реально интересная.
Понял Да, тогда позже, видимо, еще спишемся)
Возможно, это просто слишком сложная задача для текущего уровня развития мл или я слишком дурак, более вероятно второе
А в чем проблема взять какой-нибудь triplet loss сеточку? Берешь уже готовую модельку с tl, обучаешь, все ок. Дальше делишь свои монетки на 64 части(условно), 8 по ширине и 8 по высоте. Сравниваешь их попарно по элементам. Все это отлично залезет в 1 батч даже на cpu. Дальше смотришь по трэшхолду где у тебя различия, и если хочешь - берешь отдельный квадрат, и делаешь с ним то же самое. После этого, условно говоря, за 2 батча можно найти различия в монетках на площади в 64х64 квадрата, что на изображении 256х256 эквивалентно 4 пикселям. Это ж чисто инженерная задача, чо тут думать то.
Пробовал, слишком маленький датасет
Для этого надо будет картинку каждую размечать. Self supervised, вроде, работать не будет.
Не нужно. Триплет лосс же🤷♂
Как ты себе представляешь это? Self supervised не так работает.
Обсуждают сегодня