следующему кейсу. Пришел ко мне человек и спрашивает.
"Есть задача в сравнении фото между собой
что имеем
Фото и его вектор (текст около 32к символом)
Таких фото в базе 60 000
При поступлении нового фото и вектора в бд необходимо сравнивать (проводить некоторые манипуляции с данными) новый вектор со всеми которые есть в бд по очередно и отдавать результат"
Насколько я понимаю хранить в базе фото - такая себе затея, лучше держать на ФС, а в базе ссылки/хеши и т.д.. Насколько это реализуемо в принципе на мощностях монги?
уточните задача в хранении фото или же в сравнении векторов?
если на равенство сравнивать, то можно хранить md5 и сравнивать их, он ложатся в 16-байтные поля для uuid-ов, и перебираются очень быстро. Если частичное сравнение, то это сложнее, конечно.
Обсуждают сегодня