172 похожих чатов

Так как я предложил вариант с ETL сразу могу сказать

где и что может пойти не так:

- Переодичность не слишком ли частая для ежемесячного отчета? Нагрузку дополнительную не сделаете? Может лучше выгружать раз в день во время минимальной активности (например ночью)
- С удалением разобрались, вроде не может быть. Хотя опыт подсказывает, что иногда и такое происходит
- Обновление записи предусматривается? Если так, то нужно продумать и этот момент
- Флаг выгрузки хранить это Worst Practice.
+ Учитывая реализацию MVCC в pg у вас будет фактически происходить DELETE+INSERT на каждый ваш UPDATE, что породит дополнительную нагрузку на систему
+ Если когда-то надо будет в разные конечные системы гнать информацию, то для каждой системы поле не добавишь
+ Ну и готовьтесь, что при первом запуске скрипта у вас вся таблица увеличится в два раза

Как можно сделать:

- Если у вас данные Append Only добавить в таблицу поле "created_at timestamp with timezone DEFAULT CURRENT_TIMESTAMP NOT NULL"
- Если подразумевается, что данные изменяются, то стоит добавить "updated_at timestamp with timezone DEFAULT CURRENT_TIMESTAMP NOT NULL" и задействовать тригер moddatetime() из spi расширения (https://www.postgresql.org/docs/9.1/contrib-spi.html). Пример использования можно найти в исходниках pg: https://github.com/postgres/postgres/blob/REL9_3_STABLE/contrib/spi/moddatetime.example
- Обязательно ввести понятие системы источника, например callcenter1.datadescription и callcenter2.datadescription, так будет проще ориентироваться, откуда данные пришли
- Брать данные в часы простоя системы
- Брать не на сейчас, а например за предыдущие сутки + 1 день, что снизит вероятность, что вы что-то забудете
- Сверять новую / обновленную информацию уже в системе в которую будете загружать
- Создать метахранилище, в котором хранить информацию: система источник, когда данные были забраны, когда обработаны и статус обработки.
- Продумать возможность повторной выгрузки данных

2 ответов

6 просмотров

Вот это я и имел в виду, когда писал "запросто даст Вам в центральной базе неконсистентную кашу". Т.е. это всё — попытка реализации консистентной (или нет?) односторонней логической репликации "своими руками", по большому счёту. Т.е. тут и писать не так уж мало, да и "накосить" легко. Может быть, стоит поискать готовое решение?

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Ты просто гитлеровскую эстетику плохо понимаешь. Он же всё под Цезаря делал. А это как бы запрещённый приём в политике. Пиджаки они зачем все носят? Чтобы показать что они тип...
Ivan Kropotkin
4
а чем лучше всего сделать глобальный лок, если много нодов, до сотни? ну то есть мне надо, чтобы некоторые операции с объектом не происходили одновременно. перемещение между н...
Д. П.
15
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Hi guys, I'm looking for a good LLM course. Is there any course to learn LLMs in advanced? I'm aiming to use them in my apps, so a perfect course in my openion, is not only a ...
Taha
14
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
$params = [ 'formid' => 'feedbackForm', 'formTpl' => '@CODE: <form class="form-validate" data-id="ajax_form"> <fieldset class="margin-bottom-md"> ...
Pathologic
1
Карта сайта