новости, так и изображения из неё. Изображений может быть несколько, а может не быть вообще. Я написал нейросеть, которая пытается по тексту классифицировать новость. Но вот как быть с изображениями ?
1) Если изображения нет, то будет ли ОК загрузить полностью черную картинку, например ? Или есть подход получше ?
2) Не совсем понятно как нейросети подать сразу несколько изображений для одной новости. Можно, например, продублировать новость в датасете столько раз, сколько встречается картинок, но я снова не уверен, что это ОК. Это норм ? А если нет, то какие альтернативы ?
Собирал датасет картинок парсингом новостей, Подтверждаю слова Сергея. Картинка в среднем только в около 12% случаев была уникальная и относилась только к статье. Лучше сосредоточиться на тексте.
Обсуждают сегодня