меня есть спиоск фотографий и label к какой категории они относится . Мне надо определять по новым фотографиям к какой категории их надо отнести. Я решил задачу так : прошелся по фотографиям готовой моделью и достал что там есть на фотке ( типо фотография с машиной : car ) , потом получился массив текстов, например : ([car wheel brake window], ‘cars’,) . заэнкодил это tfIdf и сделал кластеризацию через kmeans. У меня получились класстеры, но вопрос в том что когда я пишу какой-то треш типо как label, например abracadabra то он кидает во второй кластер , а я бы хотел чтобы он подсказал мне что он типо аномалия. Подскажите если я вообще в правильно направлении иду?
У тебя метод не подразумевает выявление аномалий на момент кластеризации. По хорошему, tf-idf это и есть выявление аномалий в каком-то смысле :)
Замени k-means на GMM
Обсуждают сегодня