во время рефреша, чтобы потом можно было её переименовать на целевую денормализованную таблицу (назовём её denorm_table).
Так же нужно создать отдельный триггер на update/insert нормализованной таблицы (назовём её просто table), который будет добавлять в denorm_table изменения.
Подобный триггер должен быть и для таблицы, которая сторится во время refresh (назовём эту таблицу denorm_table_tmp).
Если во время рефреша приходит запрос на обновление данных, то из-за того, что есть триггер и делается refresh таблицы, будет скорей всего долгая блокировка (на время refresh-а таблицы). Так как refresh делается очень долго (30 минут), то ждать конца такой блокировки не стоит 😊.
Поэтому нужно во время refresh-а переносить данные небольшими частями (есть ещё какие-то варианты?).
Так как таблица денормализованная, то в общем случае это будет проблематично сделать (но может я чего-то не понимаю), так как в общем случае у вас может отсутствовать primary key, быть дублирующие строки в денормализованной таблице и т.д.
Но вот если у вас есть некая уникальность по полю и дубли отсутствуют, то вроде как можно сделать так:
брать небольшие куски данных из нормализованной таблицы, у которых update_at < now().
И переносить их с помощью with as x() insert into denorm_table_tmp select from x on conflict (...) do nothing
Т.е. если в denorm_table_tmp оказались данные, то это значит, что их уже триггер положил и они там самые актуальные, поэтому do nothing.
Ну а в конце сделать swap denorm_table_tmp, denorm_table и удалить denorm_table_tmp.
Тут самое главное убедиться, что, когда вы пачками переносите данные из нормализованной таблицы, то нужно не пропустить строки, для этого нужно правильно написать запрос с where и order by.
И вообще эту процедуру (refresh) вам нужно сделать один раз и всё, так как из-за триггеров у вас данные должны быть актуальными в денормализованной таблице.
Но нужно иметь код, который умеет правильно рефрешить эту таблицу в случае, когда у вас обнаружится ошибка, к примеру, неправильно написанный триггер.
Ладно, придёт Yaroslav и расскажет, как правильно это делать и что тут может пойти не так.
спасибо, мы сами примерно так и размышляли, но мы сделали таблицу с таким же название denorm_table в схеме допустим denormalization, её денормализуем, и в итоге как все заканчивается в транзакции из паблика стираем denorm_table и меняем схему из denormalization на public
Обсуждают сегодня