Когда в спарк датафрейме кастомное поле _id, то всегда в

монгу запись такая медленная?

13 ответов

25 просмотров

подробности бы не помешали) Какая скорость записи, какой кластер монги? Помимо записи, что-то еще с ней делают? Параметр spark.mongo.write.replaceDocument (могу ошибаться в названии) чему равен? Партиций скок в датафрейме?

Pavel- Автор вопроса
tenKe Titov
подробности бы не помешали) Какая скорость записи,...

Кластер небольшой, 3 ноды по 2 ядра, 8гб памяти. replaceDocument по-умолчанию, 7 партиций. Если _id оставить по-умолчанию генерируемым на стороне монги, то скорость 50-100к/сек. Если _id это одно из уникальных полей датафрейма типа long, то скорость не выше 5к/сек. Кажется, что случай типовой)

Pavel
Кластер небольшой, 3 ноды по 2 ядра, 8гб памяти. r...

На столько сильная деградация выглядит странной. Но вообще 50-100к выглядит менее правдоподобной цифрой, чем 5-10к для такого размера кластера. Попробуй поиграться с кардинальностью _id и числом партиций

Pavel- Автор вопроса
tenKe Titov
На столько сильная деградация выглядит странной. Н...

Кардинальность _id самая высокая из всех остальных, это же уникальный ключ

Pavel
Кластер небольшой, 3 ноды по 2 ядра, 8гб памяти. r...

выглядит как оверхед на проверку уникальности. если не посылать свой _id монга знает, что алгоритм монотонно дает уникальные id

Pavel- Автор вопроса
Сиплый
выглядит как оверхед на проверку уникальности. есл...

Перепроверив без спарка обычным bulkWrite, так и есть. Судя по поведению, спарк делает апдейты, предварительно делая чтение из монги.

Pavel
Перепроверив без спарка обычным bulkWrite, так и е...

попробуйте тогда не трогать _id а вместо этого создать свое поле с ключом, повесив на него индекс

Pavel
Перепроверив без спарка обычным bulkWrite, так и е...

доберусь до компа - проверю, но вообще чот странно, не было такого, обычные апдейты там

Pavel- Автор вопроса
Сиплый
попробуйте тогда не трогать _id а вместо этого соз...

Это работает хорошо, быстро) Мопед не мой) спрошу у автора зачем делает кастомные _id

Pavel
Это работает хорошо, быстро) Мопед не мой) спрошу ...

логично, т. к. индекс не делает проверку уникальность сам по себе, там global state даже не будет, скорее всего

Pavel- Автор вопроса

Похожие вопросы

Обсуждают сегодня

Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Объясните, пожалуйста, почему компилятор ругается на использование в условии неинициализированной переменной: int x; Task.Run(async () => { x = await somefunc(); }).Wait...
Александр
5
Ребят, подскажите, пожалуйста, почему в префиксе к ассетам, которые генерируются через фильтр | theme в шаблоне, стал вдруг появляться index.php? Вот так выглядит ссылка на а...
Виталий
1
Всем привет. Ребята, подскажите, пожалуйста. у ботов есть ограничение на отправку сообщений - 30 сообщений в секунду, эти ограничения накладываются на все сообщения? или на со...
Artem Stormageddon
4
Блин, ребята, сори за тупые вопросы. А можно ли как-то открыть вебапку по нажатию на кнопку в меню(которое появляется слева, команды)?
Artem Stormageddon
3
а плаксы из-под питона умеют только в комфортных условиях что-то выдавить из себя?)
Lencore
9
Но, может, есть уже проверенная? Наши требования такие: 1. Сообщения должны приходить из Инста в CRM оду 2. Должна быть возможность подключить несколько экаунтов Инстаграм. Р...
Alexander Sharoiko MSE / Александр Шаройко
13
Это может быть все-таки не флудвейт? у меня ботфазер принимает изменения и отображает даже что они изменились, на видео видно что он прислал якобы уже измененное описание, н...
OVERLINK
13
Коллеги, может знает кто, можно ли цвет бейджа счётчика в BackendMenu менять без бубнов?
Alex Blaze
3
Карта сайта