ждем пустой system.replication_queue затем делаем replace partition для загруженных данных в основную таблицу.
Что заметил - если отправлять replace partition только на одну реплику, то иногда возникает ситуация, что данные не доезжают в основную таблицу в полном объеме. Даже после ожидания system.replication_queue.
Как выходим из ситуации - отправляем replace partition на все реплики. И за счет, получается, некоторой избыточности, данные не теряются.
Но получается каждый отправленный запрос также будет реплицироваться? Т.е. если у нас 4 реплики и мы отправляем на каждую replace partition, то у нас будет уже 4*3 репликации? Вот эта избыточность в репликации - нормально? Или правильный кейс - это использование только одной реплики?
вставляете данные в промежуточную таблицу на все ноды? пустой должен быть clusterAllReplicas('{cluster}',system.replication_queue) а не только одна нода тогда
Вставляю данные на одну ноду.
а проверяете replication_queue тоже на этой ноде? replication_queue это какие данные должна ЭТА нода скачать... replication_queue для какой таблицы проверяете, для временной или для целевой? а временная таблица тоже реплицируемая?
Спасибо большое. Похоже дело именно в том, что на разных нодах я проверяю replication_queue. Временная таблица тоже реплицируемая. А в случае replace partition из временной таблицы в основную, для какой таблицы нужно ждать replication_queue? Для основной, правильно? И еще вопрос - какой кейс лучше? 1. Отправка на одну ноду, и дожидаться replication_queue на этой неделе. А репликацию на остальные ноды можно не ждать. 2. Отправка на одну ноду и ждать репликации на всех ноды 3. Отправка на все годы и ждать репликации на всех нодах
сначала вставка на одну ноду, потом просто проверял SELECT count() FROM clusterAllReplicas('{cluster}',system.replication_queue) WHERE database=? AND table=временная_таблица 0 возвращает (вставленные данные есть на всех репликах) и только после этого делал REPLACE PARTITION ... который бы отреплицировался как событие в основной таблице... и из временной таблицы ноды сами вставили данные на всех нодах
Спасибо огромное. Попробую
Возвращаюсь с обратной связью - получилось (во всяком случае, пока не поймал ошибок) если выполнять вставку и последующий replace partition на одну и ту же ноду
Обсуждают сегодня