Всем привет. Можете чисто теоритически посоветовать как ускорить миграцию? Переезд кластера postgresql10

Question

Всем привет. Можете чисто теоритически посоветовать как ускорить миграцию? Переезд кластера postgresql10

размером 3,5 Тб c Ubuntu 10.8 на redhat 7
Имеем 2 инстанса на разных портах на Ubuntu (2 Тб с 53_мя БД и 1,5 Тб с 1_ой БД),
надо все это смигрировать в один кластер в redhat
Задумка была такова:
1. Останавливаем все сервисы на 2_ух терабайтном кластере
2. Делаем полный дамп и загружаем его на другом сервере.
Со второго инстанса снимаем скрит с ролями, а затем делаем дамп БД
a) 'экспорт'
pg_dumpall -p 5454 -s | gzip -c | ssh pgХХХ 'gunzip -c > /optx/dumpall.sql'
pg_dumpall -p 5455 -r | gzip -c | ssh pgХХХ 'gunzip -c > /optx/role.sql'
pg_dump -p 5455 -d <db> | ssh pgXXX 'pg_restore -d db -j 12 /optx/<DB>.sql'
б) 'импорт'
psql -f /optx/dumpall.sql
psql -f /optx/role.sql
pg_restore -d db -j 12

выгрузка и копирование дампа (dumpall) заняла 4 часа
Загрузка полного дампа заняла 13,5 часов

#backend #devops #pgsql #programming #russian

0

28.10.2021

31 ответов

29 просмотров

Sergey Bazanov Автор вопроса

Nariman
Настроить логическую репликацию на втором инстансе...

Спасибо. Вопрос, расположение базы данных в разных каталогах повлияет как-то на логическую репликацию? И второе. Придется на каждую БД создавать подписку?

0

28.10.2021

Yaroslav Schekin

А физической репликацией / backup не получится (они несовместимы, да?)? Просто уточняю.

0

28.10.2021

Ilya Anfimov

Вот мой ответ на похожый вопрос, который мне пока что нравится: https://t.me/pgsql/335316 Там, правда, про downtime, а не про скорость как таковую.

0

28.10.2021

Ilya Anfimov

А, не посмотрел, что вы ещё и реально изменяете расположэние данных. Тогда могу, чисто теоретически, делать слияние на одном сервере. То есть загрузить всё как есть, а потом вливать второй в первый. Но вообще, конечно, кардинальные изменения структуры не делаются просто, и это нормально.

0

28.10.2021

Sergey Bazanov Автор вопроса

Yaroslav Schekin
А физической репликацией / backup не получится (он...

Я не проверял, т.к. другая ОС, другое расположение данных + как я писал барман бэкапит около 10 часов, значит восстановление 5-6 часов. А это одно и тоже время

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
Я не проверял, т.к. другая ОС, другое расположение...

> т.к. другая ОС Там не так уж много ключевых моментов (архитектура, locales) — можно было бы посмотреть / проверить. > другое расположение данных В смысле? В data directory же всё равно расположение одинаковое (где-то выносят config-и и log-и, но это мелочи)? > как я писал барман бэкапит около 10 часов А как так выходит, что дамп у Вас снимается быстрее, чем backup? Много индексов (или mat.views)?

0

28.10.2021

Sergey Bazanov Автор вопроса

Yaroslav Schekin
> т.к. другая ОС Там не так уж много ключевых мом...

Железо. И его никто менять не будет

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
Железо. И его никто менять не будет

> Имеем 2 инстанса на разных портах на Ubuntu (2 Тб с 53_мя БД и 1,5 Тб с 1_ой БД), > надо все это смигрировать в один кластер в redhat А, увидел, извините.

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
Я не проверял, т.к. другая ОС, другое расположение...

> как я писал барман бэкапит около 10 часов, значит восстановление 5-6 часов. А это одно и тоже время Хотя это к конкретной задаче мало относится — Вы тут что-то сильно путаете. ;) "Восстановление" backup-а, снятого с кластера, который не находится под нагрузкой, всегда происходит практически мгновенно (потому что это просто запуск PostgreSQL на указанной data directory, а время recovery мало, т.к. только что был checkpoint, и WAL для "накатывания" больше нет). А по вопросу — почему Вы пытаетесь минимизировать время миграции, а не downtime, как это обычно делают, в самом деле?

0

28.10.2021

Sergey Bazanov Автор вопроса

Yaroslav Schekin
> как я писал барман бэкапит около 10 часов, значи...

Для меня это одно и тоже. Остановка сервисов будет осуществлена на время проведения работ и хотелось бы уложиться за ночь

0

28.10.2021

Sergey Bazanov Автор вопроса

Yaroslav Schekin
> как я писал барман бэкапит около 10 часов, значи...

Я бы не сказал, что происходит мгновенно (восстановление бэкапа). Конечно 5-6 часов я загнул, но за 2-3 часа не меньше.

0

28.10.2021

Ilya Anfimov

Yaroslav Schekin
> как я писал барман бэкапит около 10 часов, значи...

Ну, чтобы тэрабайт восстановился за 15 минут -- нужна скорость записи в гигабайт/секунду. И скорость чтения с (другого) носителя с бэкапом такая жэ. Это ужэ не мгновенно, и это на довольно приличном жэлезе.

0

28.10.2021

Yaroslav Schekin

Ilya Anfimov
Ну, чтобы тэрабайт восстановился за 15 минут -- ну...

Да, но зачем вообще в этой задаче этап с другими носителями? Я бы ожидал, что pg_basebackup (или аналог) будет выполняться сразу в целевую data directory. И тогда время "восстановления" — околонулевое.

0

28.10.2021

Ilya Anfimov

Можно ещё подумать чтобы восстанавливать бэкап в процэссе переливки, при помощи tee или tail -f .

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
Я бы не сказал, что происходит мгновенно (восстано...

Ну а я бы сказал, см. https://t.me/pgsql/337760 . ;)

0

28.10.2021

Sergey Bazanov Автор вопроса

Ilya Anfimov
Ну, чтобы тэрабайт восстановился за 15 минут -- ну...

Нашел логи восстановления 400 Гб бэкапа. Кусочек лога:IMPORTANT These settings have been modified to prevent data losses postgresql.conf line 709: archive_command = false postgresql.auto.conf line 3: recovery_target_timeline = None WARNING You are required to review the following options as potentially dangerous postgresql.conf line 65: unix_socket_directories = '/var/run/postgresql, /tmp' # comma-separated list of directories Recovery completed (start time: 2020-12-23 09:26:55.649496, elapsed time: 56 minutes, 27 seconds) Your PostgreSQL server has been successfully prepared for recovery!

0

28.10.2021

Ilya Anfimov

Yaroslav Schekin
Да, но зачем вообще в этой задаче этап с другими н...

Тожэ вариант.

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
Для меня это одно и тоже. Остановка сервисов будет...

Так вариант с логической репликацией как раз и используют, чтобы разделить downtime и время миграции. Т.е. кому какое дело, что DBA что-то там настроил, и оно работает себе день, или даже неделю? С т.з. пользователей только нагрузка на базу возросла, и всё. А вот когда "оно" (логическая репликация) отработает (синхронизируется), за ней следует очень быстрая миграция.

0

28.10.2021

Sergey Bazanov Автор вопроса

Yaroslav Schekin
Ну а я бы сказал, см. https://t.me/pgsql/337760 . ...

Я чуток не понял, basebackup отработает и перенесет мне инстанс с унбунту на ред хат?

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
Я чуток не понял, basebackup отработает и перенесе...

Так Вы же написали, что железо несовместимо, я правильно понял? Если в самом деле так — нет, не перенесёт. :(

0

28.10.2021

Ilya Anfimov

Sergey Bazanov
Я чуток не понял, basebackup отработает и перенесе...

В общем -- да. Правда, все индэксы текстовых полей, для которых имеет смысл collation -- лучшэ будет переиндэксировать. Но это только на ту жэ мажорную версию postgres, плюс никаких слияний баз.

0

28.10.2021

Sergey Bazanov Автор вопроса

Ilya Anfimov
В общем -- да. Правда, все индэксы текстовых полей...

К сожалению мажорные версии тоже будут отличаться. На ред хате 10.18, на другой 10.8

0

28.10.2021

Yaroslav Schekin

Sergey Bazanov
К сожалению мажорные версии тоже будут отличаться....

Это минорные. ;)

0

28.10.2021

Ilya Anfimov

Sergey Bazanov
К сожалению мажорные версии тоже будут отличаться....

Это одна версия, там начиная как раз с 10 -- стало играть роль только первое число.

0

28.10.2021

Sergey Bazanov Автор вопроса

Ilya Anfimov
Это одна версия, там начиная как раз с 10 -- стало...

очепятался. Вы рекомендуете мне настроить логическую репликацию? Я правильно Вас понял?

0

28.10.2021

Ilya Anfimov

Sergey Bazanov
очепятался. Вы рекомендуете мне настроить логическ...

1) Не то, чтобы я что-то рекомендую. Чтобы давать рекомендацыи в таких вещах мне, разумеется, надо гораздо лучшэ понимать вашу ситуацыю. Жэлательно погрузиться в это дело, выписать требования, оцэнить возможности, прикинуть риски. А тут я так, вспоминаю свой былой опыт помаленьку. 2) Логическая репликацыя (любая из трёх) -- действительно можэт свести к минимуму даунтайм, да и риски того, что что-то пойдёт не так и выйдет за отведенное время. Довольно безопасное решэние. Но у неё, конечно, потребуется поработать на настройку и проверку, что всё работает. Одно перечисление таблиц некоторое время займёт. Схемы, опять жэ, руками заливать. В случае встроенной репликацыи -- скрипты для обновления sequence. А если в таблицах есть row security -- то по-моему вообще всё будет тяжко.

0

28.10.2021

Sergey Bazanov Автор вопроса

Ilya Anfimov
1) Не то, чтобы я что-то рекомендую. Чтобы давать ...

Спасибо БОЛЬШОЕ. С логической репликацией знаком (создавал ее на 3 серверах и опплевался) Это муторное и очень долгое занятие, еще если не будет первичных ключей, то ... Я пока исхожу из того, чтобы мне как меньше было работы. Еще раз сасибо.

0

28.10.2021

Sergey Bazanov Автор вопроса

Sergey Bazanov
Спасибо БОЛЬШОЕ. С логической репликацией знаком (...

Кстати, Вы не в курсе? Логическую репликацию можно создать на весь кластер, а не по БД и их схемам?

0

28.10.2021

Ilya Anfimov

Sergey Bazanov
Кстати, Вы не в курсе? Логическую репликацию можно...

Вряд ли. Точнее, по схемам-то необязательно -- одна публикацыя можэт передавать сколько угодно таблиц в разных схемах. И одна подписка. А вот на каждую базу данных -- всё своё, конечно, должно быть.

0

28.10.2021

tsla

Nariman
Настроить логическую репликацию на втором инстансе...

Зачем удалять индексы? Ничего не понятно

0

13.11.2021

Nariman · Accepted Answer

Nariman

Настроить логическую репликацию на втором инстансе. На субскрипшине удалить индексы , добавить индексы после начальной синхронизации. (не удаляя İDENTİTY )

0

28.10.2021

172 похожих чатов

Всем привет. Можете чисто теоритически посоветовать как ускорить миграцию? Переезд кластера postgresql10

31 ответов

Похожие вопросы