Господа и дамы, всем дня. Вновь обращаюсь к вам за

Question

Господа и дамы, всем дня. Вновь обращаюсь к вам за

советом:
Ночью в лог насыпало ошибок "requested WAL segment 0000000100000C0000000016 has already been removed"
Соответственно реалтайм реплика начала отставать, а в след за ней и вторая реплика, подключенная к первой, с отставанием.
Релатайм была перезалита и проблема ушла, однако сохранилась на второй этот способ не помог, и там проблема сохранилась, разве что ругается теперь на другой сегмент. Куда копать и как можно избежать подобного?

#backend #devops #pgsql #programming #russian

0

22.08.2023

23 ответов

44 просмотра

Artem M Автор вопроса

забыл, postgresql 14, Ubuntu 20.04

0

22.08.2023

Artem M Автор вопроса

D
надо увеличить максимальные размеры вала в настрой...

Правильно я понимаю, речь про wal_keep_size?

0

22.08.2023

Iliya

использовать слоты репликации или понадеяться на лучшее, увеличив wal_keep_size

0

22.08.2023

Yaroslav Schekin

Да как обычно — архив WAL, слоты... а какой метод репликации используется, вообще?

0

22.08.2023

D

Artem M
Правильно я понимаю, речь про wal_keep_size?

да, его надо поставить в половину свободного места на диске например

0

22.08.2023

Artem M Автор вопроса

Yaroslav Schekin
Да как обычно — архив WAL, слоты... а какой метод ...

Потоковая репликация

0

22.08.2023

Iliya

D
да, его надо поставить в половину свободного места...

и впустую потратить половину свободного места на диске)

0

22.08.2023

Artem M Автор вопроса

Iliya
использовать слоты репликации или понадеяться на л...

Вот тут тоже уточню пожалуй, если мне не изменяет память - слот сначала надо создавать, а потом уже через него пускать реплику? Это ж, получается, пересобирать каскад опять придется

0

22.08.2023

Yaroslav Schekin

Artem M
Потоковая репликация

Тогда подходит и то, и другое, да.

0

22.08.2023

Iliya

слот можно в процессе создать и указать реплике, если я правильно помню, попробуй

0

22.08.2023

Artem M Автор вопроса

Iliya
слот можно в процессе создать и указать реплике, е...

Вот в слотах меня смущает один момент, что если по какой-то причине отвалился ведомый - WAL начинает копиться же на мастере, и сжирает место, что при высокой нагрузке имеет вариант обвалить вообще все. Поправьте если я ошибаюсь

0

22.08.2023

Iliya

Artem M
Вот в слотах меня смущает один момент, что если по...

ага, нужен мониторинг, хотя бы базовый свободного места по-хорошему -оставание реплики

0

22.08.2023

Artem M Автор вопроса

Iliya
ага, нужен мониторинг, хотя бы базовый свободного ...

Вот я как раз на фоне этого и задумался про мониторинг отставания, это надо какой-то скрипт придумывать который будет смотреть статистику репликации и алертить. Свободное место то можно через node_exporter мониторить, а вот отставание я пока не придумал....

0

22.08.2023

Artem M Автор вопроса

Iliya
слот можно в процессе создать и указать реплике, е...

Вот как указать что-то пока не нашел...

0

22.08.2023

Roman

Artem M
Вот я как раз на фоне этого и задумался про монито...

postgres_exporter в помощь

0

22.08.2023

Artem M Автор вопроса

Roman
postgres_exporter в помощь

он умеет мониторить отставание? Хм... видимо что-то пропустил в описании

0

22.08.2023

Ilya Anfimov

Artem M
Вот тут тоже уточню пожалуй, если мне не изменяет ...

Нет, последовательность не слишком важна. Если реплика работает — ей можно добавить слот. (Часто его создают заранее, в рамках pg_basebackup — чтобы уж точно все WAL от момента бэкапа до поднятия реплики остались на месте. Удобно. Но это необязательно).

0

22.08.2023

Ilya Anfimov

А что, разве логическая не можэт брать WAL из архивов?

0

22.08.2023

Artem M Автор вопроса

Я вот пока не нашел как уже работающую реплику перевести в слот, может быть подскажете? Я б сразу на кошках попробовал

0

22.08.2023

Ilya Anfimov

Artem M
Вот я как раз на фоне этого и задумался про монито...

table bloat и index bloat сразу заодно начните мониторить.

0

22.08.2023

Yaroslav Schekin

Ilya Anfimov
А что, разве логическая не можэт брать WAL из архи...

Может. Это же не все используемые методы репликации, я это имел в виду (мало ли, что там у кого может быть).

0

22.08.2023

Ilya Anfimov

Artem M
Я вот пока не нашел как уже работающую реплику пер...

Создаёшь на ведущем слот ( pg_create_physical_replication_slot() ), на ведомом указываешь его в primary_slot_name. И ведомого перезапускаешь, кажэтся.

0

22.08.2023

D · Accepted Answer

D

надо увеличить максимальные размеры вала в настройках, чтобы реплика могла догнать за то время пока нет коннекта между ними, а потом перезалить реплику и перезапустить стриминг вала (включить кластер реплики в режиме реплики)

0

22.08.2023

172 похожих чатов

Господа и дамы, всем дня. Вновь обращаюсь к вам за

23 ответов

Похожие вопросы