Привет, есть CV задача, которую не понимаю как решить. Есть

Question

Big Data Science :: AI / Big Data / Machine Learning / MLOps

Привет, есть CV задача, которую не понимаю как решить. Есть

монеты на весь кадр. Надо найти область которой они отличаются друг от друга. Насколько я понимаю, это классический CV. Нашёл круг с помощью Hough circle. Удалил фон монеты. После усреднил гистограмму и нашёл canny. После смотрю где самый большой STD. Проблема в том, что монеты не идеально отцентрованны. Соответственно, происходят лишние шумы. Что стоит делать? Пока есть идеи делать feature matching и накладывать монеты по features друг на друга... Есть идеи или мб уже готовое решение?

#database #programming #russian #software

0

03.08.2020

9 ответов

40 просмотров

Vadim Chashechnikov Автор вопроса

Пользователь 61b16
Так, я пропустил, ты, в итоге, разобрался с этой з...

Привет, я в итоге ещё не написал решение буду ли я заниматься проектом, ибо данных слишком мало для сети, а не сетью никак не получалось. Был план, что нахожу монету с помощью hough circle, после поворачиваю с помощью fourier-merlin, после нахожу фичи с помощью sift. Но что я только не пробовал, везде капец. После был проект, который надо быстро сделать, может быть на этой недели ещё раз посмотрю, ибо задача реально интересная.

0

30.09.2020

Пользователь 61b16

Vadim Chashechnikov
Привет, я в итоге ещё не написал решение буду ли я...

Понял Да, тогда позже, видимо, еще спишемся)

0

30.09.2020

Vadim Chashechnikov Автор вопроса

Пользователь 61b16
Понял Да, тогда позже, видимо, еще спишемся)

Возможно, это просто слишком сложная задача для текущего уровня развития мл или я слишком дурак, более вероятно второе

0

30.09.2020

Vyaches

Vadim Chashechnikov
Привет, я в итоге ещё не написал решение буду ли я...

А в чем проблема взять какой-нибудь triplet loss сеточку? Берешь уже готовую модельку с tl, обучаешь, все ок. Дальше делишь свои монетки на 64 части(условно), 8 по ширине и 8 по высоте. Сравниваешь их попарно по элементам. Все это отлично залезет в 1 батч даже на cpu. Дальше смотришь по трэшхолду где у тебя различия, и если хочешь - берешь отдельный квадрат, и делаешь с ним то же самое. После этого, условно говоря, за 2 батча можно найти различия в монетках на площади в 64х64 квадрата, что на изображении 256х256 эквивалентно 4 пикселям. Это ж чисто инженерная задача, чо тут думать то.

0

30.09.2020

Vadim Chashechnikov Автор вопроса

Vyaches
А в чем проблема взять какой-нибудь triplet loss с...

Пробовал, слишком маленький датасет

0

01.10.2020

Vadim Chashechnikov Автор вопроса

Vyaches
А в чем проблема взять какой-нибудь triplet loss с...

Для этого надо будет картинку каждую размечать. Self supervised, вроде, работать не будет.

0

01.10.2020