ноды, 2 активные, одна для кворума. Предположим одна отъехала, причины не важны, подняли через час. Соответственно на той, что подняли данные не актуальны и нужна синхронизация, при запуске синка, на рабочей я так понимаю врайты будут недоступны, потому что будет шуршать wsrep. Соответственно чем больше БД, тем больше время восстановления, а для он-лайна это боль, какие варианты вообще есть и есть ли?
Может увеличить кол-во нод в кластере? Но это просто догадка, я не имел опыта такого
вам бы документацию почитать о том как работает галера и многие вопросы сами собой отпадут (и скорее всего появятся другие, более интересные). когда ноды сформировали "primary component" (i.e. quorum) не важно кто и сколько раз будет присоединятся. запись как работала, так и будет работать: потому что кворум есть, а новая нода в состоянии desync и в формировании кворума не участвует. у вас небольшой interruption в обслуживании запросов в момент когда нода упадет. в этот момент нужно пересобрать primary component из того, что есть и пока арбитр не подтвердит, что вторую ноду он тоже не видит ничего не будет обрабатываться. сколько это продлится: зависит от network latency. обычно это миллисекунды. отсюда еще растут ноги второй проблемы. если у вас будет полноценный сплит брейн, т.е. активные ноды друг друга не видят, а арбитр видит обоих, то primary component собран не будет и обе ноды не будут обрабатывать никакие запросы. если позволите, то я дам вам совет: rtfm (не декларируйте здесь, что вы что-то читаете, а именно читайте. ваши вопросы обнажают полное отсутствие базовых знаний о галере)
Спасибо за ответ, теперь ясно куда копать, я и не скрывал, что мог плохо документацию читать, о чем выше и написал.
Обсуждают сегодня