184 похожих чатов

Добрый день! Разбираюсь с async_insert режимом (https://clickhouse.com/docs/en/operations/settings/settings/#async-insert). В документации написано,

что дедупликация данных в этом режиме не работает. Можете, пожалуйста, подсказать, а что здесь подразумевается под дедупликацией данных, может на примере?

10 ответов

20 просмотров

Клик дедублицирует данные если они в одном окне, как я помню в 100 строчках, если там есть дубль, то при вставке он будет удалён

.sha- Автор вопроса
Константин
Клик дедублицирует данные если они в одном окне, к...

а как такая ситуация вообще может произойти? только когда клиент допускает ошибку и делает 2 одинаковых запроса в базу?

.sha
а как такая ситуация вообще может произойти? тольк...

Насчёт двух одинаковых запросов на вставку, clickhouse тоже может их убирать.

.sha- Автор вопроса
Константин
Насчёт двух одинаковых запросов на вставку, clickh...

Ну а в целом какой основной use-case этой функциональности? Я просто пытаюсь понять, насколько критично терять дедупликацию в случае async_insert. Имеется ли тут в виду какие-то особенности работы, например, репликации по нескольким серверам, когда в результате репликации может появиться 2 одинаковых ряда

Data blocks are deduplicated. For multiple writes of the same data block (data blocks of the same size containing the same rows in the same order), the block is only written once. The reason for this is in case of network failures when the client application does not know if the data was written to the DB, so the INSERT query can simply be repeated. It does not matter which replica INSERTs were sent to with identical data. INSERTs are idempotent. Deduplication parameters are controlled by merge_tree server settings

Denny [Altinity]
Data blocks are deduplicated. For multiple writes ...

А если тот блок, который я вставил, смержился в один парт, дедупликация уже не сработает?

Max Makarov
А если тот блок, который я вставил, смержился в од...

работает. там хранятся контрольные суммы последних 100 инсертов, парты не играют роли https://kb.altinity.com/altinity-kb-schema-design/insert_deduplication/

Denny [Altinity]
работает. там хранятся контрольные суммы последни...

Это работает только если таблица реплицируемая?

Max Makarov
Это работает только если таблица реплицируемая?

https://kb.altinity.com/altinity-kb-schema-design/insert_deduplication/ create table test_insert ( A Int64 ) Engine=MergeTree order by A settings non_replicated_deduplication_window = 100;

Похожие вопросы

Обсуждают сегодня

я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
в сях есть множество как в питоне? для удаление дубликатов
Linus
25
читать файл максимально быстро? странный вопрос))
zamtmn
53
тоесть, указав return eax, сгенерируется никому ненужная инструкция mov eax,eax ?
Aiwan \ (•◡•) / _bot
24
How to create an OS in C? what to study?
Linus
18
а как бы вылезти из ИО, что то типа IO -> Ether или в какую сторону смотреть ? что то туплю
Fedor
9
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
Всем доброго вечера! Хочу поделиться своим злоключением с человеком, который, как оказалось сюда тоже скидывал свое резюме. Жаль, что я вашу группу не нашел раньше… человек ки...
Роман Ахмедзянов
4
Компания Elif ищет менеджера проектов, который будет заниматься поиском и ведением новых проектов. Прежде чем приступить к работе, вам нужно пройти наш недельный курс, где вы ...
Elif
5
Привет, кто может сделать юзербота с апи? Задачи: - создавать группы - создавать каналы - задавать для созданных каналов аватарку или эмоджи, имя группы - добавлять в группы...
Lencore
11
Карта сайта