прошу прощения) вопрос по распределенным таблицам, например такой сценарий работы -
В обычное время есть одна нода нода0 с ch сервисом который управляет парой distributed таблиц (хоть и дистрибьютед но, они пока на одной ноде0 живут и в одном контейнере ch) в одной данные есть (несколько миллионов однотипных строк) в другой нет.
Предположим, что начинает работать алгоритм:
1шаг добавляется набор нод, и на каждой запускается 1 контейнер ch который как либо преднастроен обслуживать distributed таблицы с той ноды0 (то есть на этом этапе мы имеем уже «кластер ch» обслуживающий те первые две таблички с ноды 0)
2шаг на этих же новых нодах запускается набор сервисов которые работают! (из одной таблички читают, в другую пишут) каждая с контейнером ch расположенном на своей ноде
3шаг сервис/пользователь на ноде0 периодически выполняет запросы к своей ноде0 и радуется изменениям в таблице в которую на всех узлах вставляются данные.
Собственно вопросы, 1. рабочая ли схема? (Понятно в табличке из которой читают сервисы не миллиарды записей а несколько миллионов ну и табличка в которую пишут все ноды, записей несколько миллионов появляется.) 2. Если рабочая, то какие есть API средства для контроля завершения «разлива» таблицы ноды 0 по остальным?
вы хотите добавить реплики (копии позже), это очень легко реализовать с помощью replicated* таблиц. То что все данные переданы и реплики синхронны можно мониторить через таблицы replication_queue и parts.
Обсуждают сегодня