текстовые и достаточно большие, поэтому монга крашится из-за лимита в 16 мегабайт на 1 документ
есть ли какая-то функция, которая позволит взять хеш от значения поля и добавить его в сет?
А почему бы для таких полей не хранить отдельно md5 строку, и делать group по ней
да, это вариант, но он мне сейчас не нужен: легче извернуться в агрегации, чем бежать по всей коллекции существующей
как вы делаете подсчет что вылезаете за 16мб?
md5 лучше хранить в поле типа UUID
Там все из-за одного текстового поля, который есть во всех документах
вы эти доки собираете чтоли?
Обсуждают сегодня