картинок и для каждой картинки есть набор некоторых численных признаков (численных, категориальных), которые к ней относятся. Как в таком случае обычно стекают модели и извлекают признаки из изображения?
В голову нейронной сети.
перед полносвязным слоем то есть?
Заменяешь полносвязный слой на полноценный перцептрон и конкатенируешь к эмбеддингам сетки.
Обычно юзают что то типо пары cnn слоев для извлечения признаков а потом их подают в (трансформеры, сектусек, берты , для получения признаков )
На тензерфлоу есть пример извлечения текста из картинки (если я правильно понял это примерно то что нужно )
Обсуждают сегодня