на каждой ноде реализовоан отдельный шард.
1. если селектить с одного шарда обычную таблицу MergeTree, тогда будут использоваться вычислительные мощности только одной машины?
2. если селектить с одного шарда таблицу ReplicatedMergeTree, тогда будут использоваться мощности всех нод в кластере?
или как?
Реплики не паралеллятся*. Если у вас данные разбиты по шардам, то паралеллятся. * На самом деле есть механизм для распределения нагрузки по репликам, но он кривой и его хотят переписать
Если отправить запрос на сервер, он его и исполнит. Тут нет магии. Однако есть таблица Distributed. Это такой прокси. Она переправит запрос на несколько серверов, те их исполнят, результат объединяется. Если вы правильно разложили данные по шардам-серверам, то можете получить ускорение запроса, который читает слишком много данных. Replicated - для надежности. Они просто стягивают друг с друга поступающие блоки данных. Можете перед группой Replicated поставить load-balancer. Тогда получите кратное увеличение rps
Обсуждают сегодня