184 похожих чатов

Добрый день, Подскажите пожалуйста не могу понять что я не

правильно делаю

У нас есть одна таблица которая replicated на 3-х серверах (идентичные копии) и есть таблица которая distributed которая смотрит на 3 эти сервера

Задачи получить Triple Read Gain, но я четко вижу что когда бежит запрос то читает clickhouse с одного сервера, а на двух других серверах ничего не происходит в этот момент, нет загрузки CPU, IO etc.

Что я упуская и по какому принципу вообще такой вид запрос может делать distributed computation of results ?

Заранее спасибо

Павел

# SCHEMA
CREATE TABLE fgi.articles_fts
(
keyword String,
internal_id String,
publish_date DateTime('UTC')
)
ENGINE = Distributed('cluster', 'fgi', 'articles_fts_data', rand())

# EXPLAIN
explain select count(*) from fgi.articles_fts;

EXPLAIN
SELECT count(*)
FROM fgi.articles_fts

┌─explain─────────────────────────────────┐
│ ReadFromStorage (Read from Distributed) │
└─────────────────────────────────────────┘

1 rows in set. Elapsed: 0.012 sec.

# CONF
<yandex>
<cluster>
<cluster>
<shard>
<internal_replication>true</internal_replication>
<replica>
<host>1.internal</host>
<port>9000</port>
</replica>
<replica>
<host>2.internal</host>
<port>9000</port>
</replica>
<replica>
<host>3.internal</host>
<port>9000</port>
</replica>
</shard>
</cluster>
</remote_servers>
</yandex>

6 ответов

13 просмотров

Я могу ошибаться но разве distributed таблицы работают с replicated? Вроде как они предназначены для работы с шардированными таблицами. И как мне тут недавно объясняли на обычном селекте даже с шардированными таблицами прироста скорости не будет.

tg usr
Я могу ошибаться но разве distributed таблицы рабо...

replicated могут быть и не быть шардированными. смотря с какой стороны смотреть

【D】【J】
replicated могут быть и не быть шардированными. см...

Это я понимаю что они могут быть не шардированными, просто тут вопрос, а разве distributed будет работать быстрее просто на нешардированных replicated таблицах?

https://clickhouse.tech/docs/ru/operations/settings/settings/#settings-max_parallel_replicas + SAMPLING на таблице пробовали?

Pavel-Nemirovsky Автор вопроса
Pavel-Nemirovsky Автор вопроса

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта