172 похожих чатов

Всем привет. Такая проблема: во время бэкапа (потоковый barman) на сервере

бэкапа кончилось место, бэкап повис. Все было ночью.
Мастер начал копить wal и со временем тоже съел все место и упал.
Отключили бэкап, почистили место (wal не трогали), запустили репликацию (2 реплики).

После на каждой реплике селекты висят по пол часа, процессор к 100%.
Не понятно на чем они висят, блокировок нет.
Чо заметил, на одной реплике бесконечно висит startup process recovering, но тоже не зависший, выполняется, просто не уходит из процессов, на второй токого нет.

Диск при это особо не нагружен, только проц.
Куда можно глянуть, в чем может быть проблема?
Может ли быть причина в том, что произошло или совпадение ?

8 ответов

20 просмотров

А слот репликацыи для бармана там не завис случайно?

Ну, собственно, банальное: если висит много wal -- то, надо думать, их что-то держыт.

Vladimir- Автор вопроса
Ilya Anfimov
Ну, собственно, банальное: если висит много wal --...

нет, его вообще щас отключили. wal маленький. Лаг репликации тоже не большой 0.05c

Vladimir
нет, его вообще щас отключили. wal маленький. Лаг ...

Тогда, раз проблема со скоростью запросов -- то ответ стандартный для тормозящих запросов. https://t.me/pgsql/303899 И начинать разбираться -- кто, чего, сколько, и как это можно поправить.

На реплике walы тожэ маленькие?

Vladimir- Автор вопроса
Vladimir
на реплике почти пустые

Есть, кстати, одна идея -- а можно к одной (для начала) реплике запретить подключения на какое-то время? Можэт, ожывёт всё?

И да, сейчас негде поиграться -- но по идее, само по себе состояние "startup process recovering" -- это нормально совершэнно. Оно вроде появляется, когда прочитан новый кусок streaming replication, и он переносится в buffers. Просто обычно оно не очень видно, поскольку это недолго каждый раз происходит. А вот то, что оно почему-то занимает заметный процэнт времени -- это странно. Но, повторюсь, не уверен в этих своих словах на 100%.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта