184 похожих чатов

Добрый день! Разбираюсь с async_insert режимом (https://clickhouse.com/docs/en/operations/settings/settings/#async-insert). В документации написано,

что дедупликация данных в этом режиме не работает. Можете, пожалуйста, подсказать, а что здесь подразумевается под дедупликацией данных, может на примере?

10 ответов

49 просмотров

Клик дедублицирует данные если они в одном окне, как я помню в 100 строчках, если там есть дубль, то при вставке он будет удалён

.sha- Автор вопроса
Константин
Клик дедублицирует данные если они в одном окне, к...

а как такая ситуация вообще может произойти? только когда клиент допускает ошибку и делает 2 одинаковых запроса в базу?

.sha
а как такая ситуация вообще может произойти? тольк...

Насчёт двух одинаковых запросов на вставку, clickhouse тоже может их убирать.

.sha- Автор вопроса
Константин
Насчёт двух одинаковых запросов на вставку, clickh...

Ну а в целом какой основной use-case этой функциональности? Я просто пытаюсь понять, насколько критично терять дедупликацию в случае async_insert. Имеется ли тут в виду какие-то особенности работы, например, репликации по нескольким серверам, когда в результате репликации может появиться 2 одинаковых ряда

Data blocks are deduplicated. For multiple writes of the same data block (data blocks of the same size containing the same rows in the same order), the block is only written once. The reason for this is in case of network failures when the client application does not know if the data was written to the DB, so the INSERT query can simply be repeated. It does not matter which replica INSERTs were sent to with identical data. INSERTs are idempotent. Deduplication parameters are controlled by merge_tree server settings

Denny [Altinity]
Data blocks are deduplicated. For multiple writes ...

А если тот блок, который я вставил, смержился в один парт, дедупликация уже не сработает?

Max Makarov
А если тот блок, который я вставил, смержился в од...

работает. там хранятся контрольные суммы последних 100 инсертов, парты не играют роли https://kb.altinity.com/altinity-kb-schema-design/insert_deduplication/

Denny [Altinity]
работает. там хранятся контрольные суммы последни...

Это работает только если таблица реплицируемая?

Max Makarov
Это работает только если таблица реплицируемая?

https://kb.altinity.com/altinity-kb-schema-design/insert_deduplication/ create table test_insert ( A Int64 ) Engine=MergeTree order by A settings non_replicated_deduplication_window = 100;

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта