Всем привет, вопрос такой. Каким образом ускорить восстановление базы из

Ilya Anfimov
А как получилось, что один воркер получает wal все...

А как получилось, что один воркер получает wal всего лишь на 50МБит/с ?

0

10.08.2023

Марсель Габдрахманов Автор вопроса

Pgbackrest и его настройки. 8 воркеров запущенных на получение архивов, и они просто делят диск Итоговое около 400Мбит/с

0

10.08.2023

Марсель Габдрахманов
Pgbackrest и его настройки. 8 воркеров запущенных ...

Слушай, я тогда конфиг стэнда совсем не понял. У тебя сейчас pgbackrest льёт в рамках restore_command 400 на диск? И ты чем-то недоволен?

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Ilya Anfimov
Слушай, я тогда конфиг стэнда совсем не понял. У ...

скоростью восстановления самого ПГ. Условно я загоняю 250 гигов за 10 минут, а ПГ жует их долго...

0

11.08.2023

Марсель Габдрахманов
скоростью восстановления самого ПГ. Условно я заго...

Так оно же однопоточное.

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Sergey Gr
Так оно же однопоточное.

вот видимо тут и ответ, спасибо.

0

11.08.2023

Марсель Габдрахманов
скоростью восстановления самого ПГ. Условно я заго...

Подробностей очень мало, чтобы что-то посоветовать (даже версии PostgreSQL нет?)...

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
Подробностей очень мало, чтобы что-то посоветовать...

Можно и так начать. У реплики есть Pgbackrest. Реплика на ССД находится. Pgbackrest может передавать файлы многопоточно (архивы вал). А вот Postgresql 15 тормозит наполнение, и ответ выше - он просто однопоточный. То есть выходит что скорость мастера (без синх коммита) пока что быстрее, чем восстановление реплики.

0

11.08.2023

> Каким образом ускорить восстановление базы из архивов ? Если проблема именно в "накате" WAL на реплике — есть несколько вариантов... Для начала, Вы смотрели на https://www.postgresql.org/docs/current/runtime-config-wal.html#RUNTIME-CONFIG-WAL-RECOVERY (потенциально, это может дать существенный эффект)? > Но сам процесс background worker читает / пишет на диск со скоростью не более 100 Мбит / сек. Какой именно background worker? > bgwriter настроен и имеет следующие параметры: Вы бы лучше checkpointer настраивали, а не эту "радость" (причём, если возможно, начиная с primary).

0

11.08.2023

Марсель Габдрахманов
вот видимо тут и ответ, спасибо.

Мне кажется у свежих постгресов есть аналог pg_prewarm для этапа recovery. Когда он делает readahead для блоков данных с диска, немного проглядывая WAL вперёд. Но что за параметр это контролирует и в 15 или в 16 версии он появился - не могу вспомнить.

0

11.08.2023

Марсель Габдрахманов
Можно и так начать. У реплики есть Pgbackrest. Ре...

> А вот Postgresql 15 тормозит наполнение, и ответ выше - он просто однопоточный. Что не значит, что его нельзя ускорить (см. выше). > То есть выходит что скорость мастера (без синх коммита) пока что быстрее, чем восстановление реплики. Да, такое нередко (?) случается... тем не менее, зачастую "вытащить" это можно.

0

11.08.2023

Sergey Gr
Мне кажется у свежих постгресов есть аналог pg_pre...

https://www.postgresql.org/docs/current/runtime-config-wal.html#RUNTIME-CONFIG-WAL-RECOVERY

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
> Каким образом ускорить восстановление базы из ар...

> Какой именно background worker? background writer

0

11.08.2023

Марсель Габдрахманов
> Какой именно background worker? background writ...

Ясно. Тем более см. совет в том сообщении. ;)

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
Ясно. Тем более см. совет в том сообщении. ;)

спасибо, если реплика через "ББ" не взлетит пойду опробовать.

0

11.08.2023

Марсель Габдрахманов
скоростью восстановления самого ПГ. Условно я заго...

Ssd SATA-шные? Там случайно дефолтный prefetch не оставлен? (hdparm -a /dev/... , если есть lvm — то на него тожэ) Хотя это вроде для чтения, для записи не должно влиять...

0

11.08.2023

Марсель Габдрахманов
Можно и так начать. У реплики есть Pgbackrest. Ре...

Казалось бы, не такой там большой round-trip до диска, чтобы один воркер простаивал заметное врнмя.

0

11.08.2023

Ilya Anfimov
Ssd SATA-шные? Там случайно дефолтный prefetch не...

Даже сейчас однопоточная запись по 4к относительно небыстрая.

0

11.08.2023

Sergey Gr
Даже сейчас однопоточная запись по 4к относительно...

1) Пишыте по 8к. 2) На тэстах по 8к оно у меня упирается в nvme.

0

11.08.2023

В PCI-интерфейс? В софтварную архитектуру? У меня-то тоже упирается в NVME. Просто уровень упора гораздо ниже паспортного seq write

0

11.08.2023

Sergey Gr
В PCI-интерфейс? В софтварную архитектуру? У меня...

В доку по конкретному NVMe. (Но он тогда небыстр был. Типа гига с чем-то или около полутора).

0

11.08.2023

Ilya Anfimov
В доку по конкретному NVMe. (Но он тогда небыстр ...

Посмотрел статистику своих тестов. 1.5 Гб в 48 потоков по 4к

0

11.08.2023

Sergey Gr
Посмотрел статистику своих тестов. 1.5 Гб в 48 пот...

Там, повторюсь, не 5к было. Вроде 8. Или 16. (И нет, это не постгресом тэстировал).

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
> Каким образом ускорить восстановление базы из ар...

> Если проблема именно в "накате" WAL на реплике — есть несколько вариантов... Для начала, Вы смотрели на https://www.postgresql.org/docs/current/runtime-config-wal.html#RUNTIME-CONFIG-WAL-RECOVERY (потенциально, это может дать существенный эффект)? эффекта не дало, пробовал разные размеры ставить (1 MB / 4 / 16 / 32 ) > Какой именно background worker? background writer >Вы бы лучше checkpointer настраивали, а не эту "радость" (причём, если возможно, начиная с primary). было 40 минут, поставил 30 / 20 эффекта так же нет. Мастер быстрее создает WAL, чем реплика их проигрывает.

0

11.08.2023

Марсель Габдрахманов
> Если проблема именно в "накате" WAL на реплике —...

> эффекта не дало, пробовал разные размеры ставить (1 MB / 4 / 16 / 32 ) Это всё довольно мало, нет? К тому же, он точно работает вообще (на используемой OS/FS)? И как Вы измеряете (странно, если эффекта нет вообще)? > было 40 минут, поставил 30 / 20 эффекта так же нет. Довольно странно, если от этого эффекта совсем нет (могло стать и [ощутимо] хуже, например). ;( Разве что все checkpoints на primary происходят по max_wal_size, что уже плохо. Вы можете какие-то числа показать?

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
> эффекта не дало, пробовал разные размеры ставить...

например какие числа показать ?

0

11.08.2023

Марсель Габдрахманов
например какие числа показать ?

Те, по которым Вы сделали вывод, что эффекта нет, разумеется.

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
Те, по которым Вы сделали вывод, что эффекта нет, ...

даже не знаю и с чего начать. Просто ничего не кажет к примеру реплика принимает текущий вал 00000200027B150000019 а мастер находится на создании: 000002000A7B150000019

0

11.08.2023

Марсель Габдрахманов
даже не знаю и с чего начать. Просто ничего не каж...

Но это же не серьёзно, Вам не кажется? ;( Вы бы измерили отставание (или объём применённого WAL) за какой-то период до изменения настроек, и за тот же период (при той же нагрузке) после применения настроек, например.

0

11.08.2023

Марсель Габдрахманов Автор вопроса

Yaroslav Schekin
Но это же не серьёзно, Вам не кажется? ;( Вы бы и...

могу пока только судить по "патрони" и отставание там на 1.4 ТБ

0

11.08.2023

Марсель Габдрахманов
могу пока только судить по "патрони" и отставание ...

Да Вам же скорость / ускорение этого процесса нужны (т.е. вот эти вот путь объём [применённых] WAL / время и т.п). ;) Оно же не догонит (и не отстанет) мгновенно, в любом случае...

0

11.08.2023

Ilya Anfimov · Accepted Answer