184 похожих чатов

Всем привет, у меня вопрос по сочетанию шардинга с ReplicatedMergeTree

таблицами.

Если я правильно понял, в случае если Distributed таблица смотрит в Replicated таблицы - нужно выставлять ключ internal_replication в true, и в этом случае Distributed таблица будет вставлять данные только в первую живую реплику.

Правильно ли я понимаю, что для того чтобы и репликация работала, и шардинг - нужно указать несколько реплик в каждом из шардов, а также вручную потом сходить и объявить реплики для ReplicatedMergeTree именно на тех же серверах кластера, которые указаны в качестве реплики в remote_servers ?

6 ответов

8 просмотров

в целом вы правильно поняли 1) шарды и реплики внутри шардов указываются через <remove_servers> секции в XML конфигах, чтобы данные из одного сервера реплициировались в другой надо выставлять internal_replication 2) для того чтобы проще было создавать ReplicatedMergeTree таблицы есть CREATE TABLE ... ON CLUSTER, который реплицирует DDL statements через Zookeeper 3) Distributed таблица может работать и на чтение и на запись, запись в distributed сначала разбивает данные на куски в соответствии с ключом шардирования и складывает на том сервере на котором вы INSERT запрос выполнили, а потом отсылает это все в одну из конечных реплик 4) если есть возможность разбивать данные самостоятельно, и вставлять в нужную реплику самостоятельно, то будет быстрее вставляться

никакого кластера нет. Replicated и Distributed не знают друг про друга. Поэтому делаем репликацию через Replicated. А запросы делаем через Distributed, собирая с шардов, Distributed необходимо знать про несколько (все) реплики чтобы сходить в живую. Если шард один у какой-то маленькой таблицы - дименшина и она например среплицирована 75 раз, то Distributed вообще не нужна

Nick- Автор вопроса
Slach [altinity]
в целом вы правильно поняли 1) шарды и реплики вну...

Спасибо за быстрый ответ, все же непонятно как мапить реплики из ReplicationMergeTree таблиц на шарды

Nick- Автор вопроса
Denny [Altinity]
никакого кластера нет. Replicated и Distributed н...

Получается что реплики в шардировании должны накладываться на те же сервера, где есть реплики с ReplicatedMergeTree?

Nick
Получается что реплики в шардировании должны накла...

да, Distributed ничего не знает о том где какие данные лежат. Вы должны описать шарды и внутри шардов реплики, именно так как у вас лежат данные

Nick- Автор вопроса
Denny [Altinity]
да, Distributed ничего не знает о том где какие да...

Алилуйя, спасибо. Получается, что я могу иметь реплику в ReplicatedMergeTree, но если она будет не на том сервере что указан в remote_servers в реплике - Distributed таблица о ней ничего не будет знать, и хоть данные где-то будут - прочитать через Distributed их не получится

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта