отрезали мастер по сети от остальных участников кластера и сразу же прибили на нем все процессы патрони/etcd. Что произойдет?
Произойдет следующее (убивать etcd я не рассматриваю, так как это самый простой случай) убиваем patroni-master: 1) Остается работать PostgreSQL как и работал в режиме мастера, какое то время к нему приходят запросы на ЗАПИСЬ (это уже не отногсится к Patroni, а зависит от архитектуры. В моем случае через 3-8 секунд туда перестанет поступать трафик) 2) Эти записи будут реплицироваться в штатном режиме на replicas 3) По истечению 30 секунд (По умолчанию) - TTL записи в etcd замка мастера, он будет удален и втчение 10 секунд будет выбран новый replica В случае отсутствия haproxy будет split brain! Это верно. НО. Как вы попадете на новый мастер? Если ответите (кто-нибудь) на этот вопрос, дам вам печеньку. И даже для таких случаев (У меня было LA под 20 IO под 99%, oom убивал PG и Patroni работал) У Patroni есть watchdog, который убивает сервер при вылете patroni https://github.com/zalando/patroni/blob/master/docs/releases.rst#version-13
Обсуждают сегодня