в RGW бакет, начинают отваливаться OSD по непонятной причине. Вот например osd.1 помечен как out,down, однако в его логах поочередно то пишутся дампы статистики, то вот такие строчки:
2022-02-20T20:13:18.778+0000 7f6374ba3700 -1 monclient: _check_auth_rotating possible clock skew, rotating keys expired way too early (before 2022-02-20T19:13:18.784161+0000)
Я этот бакет разделил на 1000 шардов, но все равно разваливается весь кластер когда нагрузка PUT чуть доходит до 5МБ/с.
Олсо, как правильно поднять лежачий OSD в убунте? cephadm для него не сделал старт скрипта похоже, systemctl start подсказывает лишь ceph-crash.service ceph.service.
possible clock skew - а время не разъехалось между нодами случайно?
Там только одна нода, не представляю как между докер контейнерами мог случиться рассинхрон
Обсуждают сегодня