могут распознать несколько объектов и выдать ключевые слова для них?
например, для стикера выше это будет что-то вроде cat, eyes, eyedrop
Image captioning
Обсуждают сегодня