Парни и Девочки, привет! У меня есть проблема при восстановлении

бэкапа монги. У меня выполняется бэкап шардированной монги с помощью pbm logical. В одной из коллекций попадает дубликат некоторых документов:
Если грепнуть по bson файлу, можно увидеть что по данному документу присутствует дубликат, отличающийся только по полю expiringAt.
{"_id":{"visitor":"435fu2llsdj5k68fl5vn56l","category":{"$numberLong":"1288087480"}},"expiringAt":{"$date":{"$numberLong":"1700430111337"}}}
{"_id":{"visitor":"435fu2llsdj5k68fl5vn56l","category":{"$numberLong":"1288087480"}},"expiringAt":{"$date":{"$numberLong":"1701680914145"}}}
При восстановлении базы, pbm агент доходит до дубликата и заваливается с ошибкой, не завершив процесс восстановления, что очень не очень. Есть ли варианты игнорить дубликаты или заставить агента реагировать на них адекватнее?

Кто вообще сталкивался с такой проблемой?

14 ответов

55 просмотров

глупый вопрос, но в коллекции перед восстановлением ничего нет? просто эти два _id разные и не могут вызвать E11000. И опять же приведите полностью ошибку

Anton- Автор вопроса
Nick
глупый вопрос, но в коллекции перед восстановление...

вот такие ошибки: 2023-10-13T16:02:03Z E [rs3/shard03:27017] [restore/2023-10-13T13:46:51.684551381Z] restore: mongorestore: restore mongo dump (successes: 236433292 / fails: 2): sponsore.intereste: error restoring from archive on stdin: bulk write exception: write errors: [E11000 duplicate key error collection: sponsore.intereste index: _id_ dup key: { _id: { visitorId: "435fu2llsdj5k68fl5vn56l", categoryId: 44445 } }] 2023-10-13T17:29:26Z E [rs2/shard02:27017] [restore/2023-10-13T13:46:51.684551381Z] restore: mongorestore: restore mongo dump (successes: 284324699 / fails: 1): sponsore.intereste: error restoring from archive on stdin: bulk write exception: write errors: [E11000 duplicate key error collection: sponsore.intereste index: _id_ dup key: { _id: { visitorId: "7dfed5bab75efdsj345a17", categoryId: 2568 } }]

Anton
вот такие ошибки: 2023-10-13T16:02:03Z E [rs3/shar...

а в коллекции все чисто было перед восстановлением?

Anton- Автор вопроса
Nick
а в коллекции все чисто было перед восстановлением...

да, восстановление происходит в чистый подготовленный кластер.

Anton
да, восстановление происходит в чистый подготовлен...

при восстановлении явно указываются названия коллекций откуда куда? https://www.mongodb.com/community/forums/t/monogrestore-is-always-failing-with-e11000-error/249740

Anton- Автор вопроса
Nick
при восстановлении явно указываются названия колле...

нет, не явно, восстановление происходит через pbm, восстанавливаю исходя из мануала: https://docs.percona.com/percona-backup-mongodb/reference/pbm-commands.html#pbm-restore командой: pbm restore <имя бэкапа> --mongodb-uri=localhost:27017

Anton
нет, не явно, восстановление происходит через pbm,...

тогда не знаю чего предложить по перконе опыта нет. Но это повод сходить в саппорт и выяснить в чем дело

Anton- Автор вопроса
Anton
В любом случае спасибо за помощь :)

по перконе нашлось такое https://jira.percona.com/browse/PBM-1197

Anton- Автор вопроса
Anton
Да) это мой тикет)

хех)) а какой ключ шардирования?

Anton- Автор вопроса
Anton
По ключу id

тогда мои варианты все) остаются баги выборок на границах чанков или если чанки в этот момент в состоянии миграции и почемуто доступны на разных шардах для чтения, надо шерстить ченжлоги фиксов с 5 версии мож где чего такое и всплывало. Плюс в версиях которые указаны в тикете точно есть проблемы, поэтому стоит начать с обновлением до актуальной 5.0.21

Anton- Автор вопроса
Nick
тогда мои варианты все) остаются баги выборок на г...

миграцию я частично исключил, отключив балансировку за сутки до бэкапа, но увы, в архиве все равно присутствовали дубликаты. Я вот не могу понять, данная проблема судя по всему только у меня или она у всех, просто никто не тестирует восстановление из бэкапа)

Похожие вопросы

Обсуждают сегодня

Я колись ставив гуглу антиспам 3.0, може і норм, але мені не дуже зайшло. Теж думав тиждень, що його і куди. Зупинився на трех варіантах відразу всі три і включив 1. Перевір...
𝓔𝓾𝓰𝓮𝓷𝓮𝓥 J
2
Это везде так работает, или еще колдовать нужно?)
Квадрат Гипотенузы
6
Портфолио: Зовут меня Александр, мне 36 лет. Город Пушкино. Общий рабочий стаж: ~14 лет Уровень квалификации: Senior Full-stack developer Где прочесть мой код? https://github....
Magic
10
Портфолио: Зовут меня Александр, мне 41 год. Город Киров. Общий рабочий стаж: ~14 лет Уровень квалификации: Senior Full-stack developer Где прочесть мой код? https://github.co...
Magic
11
Приветствую всех, возникла проблема, до этого писал бота в простом формате где при выполнении условий приходило через send_message информация, сейчас решил добавить хендлер на...
Andrew
4
где собака, админ группы? нычкуется и боится проявить волю, в толерантность еще не наигрался? @yelizariev
Ognezar
61
Приветствую всех, есть вопросик. Передали проект на OctoberCms, без инсталяшки в полуразвернутом виде, нужно было залить бекап бд, после залития бд, оказалось, что части строк...
Лео
14
Всем привет! Есть камеры для наблюдения с встроенной видеоаналитикой (детектор лиц, например). Как я понял, все вычисления и анализ происходят на самом железе камеры, и пр...
Артур 🌞 Сапрыкин
1
Можешь посмотреть где именно вылетает floodwait чаще всего? Просто при 1 входящем, 1 исходящем не должно быть проблем
Артем Уколов
1
Всем привет, может уже кто-то пытался выдернуть из api информацию о дате рождения пользователя Есть ли вообще такая возможность?
Artem Stormageddon
2
Карта сайта