Когда в спарк датафрейме кастомное поле _id, то всегда в

монгу запись такая медленная?

13 ответов

8 просмотров

подробности бы не помешали) Какая скорость записи, какой кластер монги? Помимо записи, что-то еще с ней делают? Параметр spark.mongo.write.replaceDocument (могу ошибаться в названии) чему равен? Партиций скок в датафрейме?

Pavel- Автор вопроса
tenKe Titov
подробности бы не помешали) Какая скорость записи,...

Кластер небольшой, 3 ноды по 2 ядра, 8гб памяти. replaceDocument по-умолчанию, 7 партиций. Если _id оставить по-умолчанию генерируемым на стороне монги, то скорость 50-100к/сек. Если _id это одно из уникальных полей датафрейма типа long, то скорость не выше 5к/сек. Кажется, что случай типовой)

Pavel
Кластер небольшой, 3 ноды по 2 ядра, 8гб памяти. r...

На столько сильная деградация выглядит странной. Но вообще 50-100к выглядит менее правдоподобной цифрой, чем 5-10к для такого размера кластера. Попробуй поиграться с кардинальностью _id и числом партиций

Pavel- Автор вопроса
tenKe Titov
На столько сильная деградация выглядит странной. Н...

Кардинальность _id самая высокая из всех остальных, это же уникальный ключ

Pavel
Кластер небольшой, 3 ноды по 2 ядра, 8гб памяти. r...

выглядит как оверхед на проверку уникальности. если не посылать свой _id монга знает, что алгоритм монотонно дает уникальные id

Pavel- Автор вопроса
Сиплый
выглядит как оверхед на проверку уникальности. есл...

Перепроверив без спарка обычным bulkWrite, так и есть. Судя по поведению, спарк делает апдейты, предварительно делая чтение из монги.

Pavel
Перепроверив без спарка обычным bulkWrite, так и е...

попробуйте тогда не трогать _id а вместо этого создать свое поле с ключом, повесив на него индекс

Pavel
Перепроверив без спарка обычным bulkWrite, так и е...

доберусь до компа - проверю, но вообще чот странно, не было такого, обычные апдейты там

Pavel- Автор вопроса
Сиплый
попробуйте тогда не трогать _id а вместо этого соз...

Это работает хорошо, быстро) Мопед не мой) спрошу у автора зачем делает кастомные _id

Pavel
Это работает хорошо, быстро) Мопед не мой) спрошу ...

логично, т. к. индекс не делает проверку уникальность сам по себе, там global state даже не будет, скорее всего

Pavel- Автор вопроса

Похожие вопросы

Обсуждают сегодня

Всем привет) Я попробовал турбо роутер октябрьский. Вроде доволен, но возникла проблемка) Бутстраповские модалки плодят .modal-backdrop элементы Если модалка открыта, должне...
Виталий
3
Так а кто может спарсить всех участников чата? Идишники
Magic
18
да пофиг на капчу зашел в чат и молчишь при этом ты нонейм? пошел вон
Magic
17
Я тебе про общие вопросы, а не про узконаправленные . Ты че будешь в чате спрашивать как хтмл разметку сделать?!
rusteg
3
Как удалить health check в Consul? Казалось бы, это должно быть не сложно, но я не могу найти в документации ничего про это, только про добавление service с health check "в н...
Roman
2
Привет, кто может сделать юзербота с апи? Задачи: - создавать группы - создавать каналы - задавать для созданных каналов аватарку или эмоджи, имя группы - добавлять в группы...
Lencore
13
Privet! Mozhet jesti ideji - nemogu sdelatj upload backup s filestore cerez WEB. Fail okolo 450mb, eto mozhet bitj prichinoi? Nemogu ponjatj..kak zagruzitj backup... Poluchaju...
Matiss 🤘 Black Oak IT 🌳 Batumi 🌴 Latvija
5
Всем доброго вечера! Хочу поделиться своим злоключением с человеком, который, как оказалось сюда тоже скидывал свое резюме. Жаль, что я вашу группу не нашел раньше… человек ки...
Роман Ахмедзянов
4
Хотя вроде админка показывает удаленные модели, да? @dblackCat
Виталий
2
Нужно магазин с тильды на опен кат перенести Есть кто умеет? В лс
Magic
8
Карта сайта