реплики, вопрос, как лучше организовать запись данных и считывание, если ж все делать на одном каком то сервере, то нагрузка будет большой? Заранее благодарен!
если полностью контроллируете процесс то шардируйте и сортируйте данные перед вставкой запись делайте непосредственно в ReplicatedMergeTree таблицы данные читайте из Distributed это наиболее быстрый вариант
а считывать данные, тоже контролировать с какого сервера лучше?
нет, там просто можно round robin выбирать любую ноду можно chproxy для чтения поставить или nginx перед кластером там у вас на схеме непонятные стрелки между шардами черные, не ясно что они значат
Да это я для себя связь обнозначил, один кластер
то есть получается отказ от автоматического шардирования
ну можно вставлять в distributed но тогда надо следить когда данные доедут до ReplicatedMergeTree и получаете в итоге записи в два раза больше сначала .bin файлы для Distributed создаются а потом они на destination nodes в ReplicatedMergeTree уже пишутся
Обсуждают сегодня