млн документов. Нужно из нее удалить дубликаты по одному полю. Стандартными операциями Mongo не работает, так как очень большая коллекция. Выгрузить всё в List и удалить дубликаты тоже не работает, в List грузит очень долго. Есть какие-то мысли, как можно почистить дубликаты?
Нада написать скрипт который будет удалить дупликаты на каждые 5000 файлов и запомнить последний индекс каждый раз
индекс - _id имеешь в виду?
не важна что главное хранить что то идентифицирующее последнее место
Обсуждают сегодня