по сети 3 нод из 7 , до 10 минут по времени ? ( osd set no...это само собой) Стоит ли заморачиваться с primary affinity ?
Если свежий кластер на cephadm, то лучше maintenance mode для каждой ноды. И убедиться, что osd можно стопать, а то вдруг копии объектов до 1 упадут.
Да,cephadm. Спасибо , попробую. Надеюсь оно у них работает )
Правильный крашмап
Увеличить число реплик или поменять домен отказа. Но это может вызвать резкую нагрузку на диски и сеть и хватит ли ёмкости свободной? При таком объёме нод на стоп и времени простоя не проще ли согловать полную остановку ночью? Это было более безболезненно и проще. Чем репликации, ждать пока оно там перельется... Это все не быстро. Увеличение числа реплик - это тормоза на запись, софту который пишет может поплохеть. Нужен ли козе баян? Вот в чем вопрос!
Ёмкости свободной должно хватить, а вот ребалансы , конечно , могут чуть испортить картину. У меня тоже была первая мысль запаузить кластер и переждать.
Обсуждают сегодня