172 похожих чатов

Ребят есть полная реплика продовой бд, при обращении к реплике

получаю:

ERROR: canceling statement due to conflict with recovery
DETAIL: User query might have needed to see row versions that must be removed.

Почекал инструкцию

https://aws.amazon.com/blogs/database/best-practices-for-amazon-rds-postgresql-replication/

Alternatively, you can enable parameters like max_standby_archive_delay or max_standby_streaming_delay on the replica instance, to enable completion of long-running read queries. Both of these parameters pause WAL replay at the replica if the source data is modified while read queries are running on the replica. A value of -1 lets the WAL replay wait until the read query completes. However, this pause increases replication lag indefinitely and causes high storage consumption at the source due to WAL accumulation.

Мое опасение, что если упадет реплика, то из-за переполнения WAL упадет и прод.
Вопрос: Что делать? Как обезопасить прод?

1 ответов

37 просмотров

Правильно будет написать проверки в мониторинг на тему того, что 1) Реплика не упала, по крайней мере не надолго. 2) WAL имеет логичный размер. 3) Рост WAL ограничен некоторыми логичными размерами. 4) Диски с WAL имеют достаточный запас места, с учётом текущего роста. На алерты каждой из проверок -- написать, и положыть где-то рядом с алертом ссылку -- на действия, которые можно срочно предпринять -- в первую очередь на дополнительные проверки -- отчего растёт WAL, как давно не было checkpoint, доступны ли все реплики.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта