184 похожих чатов

Всем привет кто-нибудь пользуется kafka-engine, сталкивались с разными проблемами, которые приводили

к дупликации данных?

13 ответов

13 просмотров

Я какое-то время назад смотрел в исходники kafkaengine - там на ура могут возникать дубликаты. Данные пишутся в clickhouse, а после этого клиент пробует закомитить оффсет. Пробует он сделать это максимум 3 раза, если мне не изменяет память.

Anton-Shchukin Автор вопроса
Alexey Churkin
Я какое-то время назад смотрел в исходники kafkaen...

вот именно. есть ли какой-нибудь експ по разрешению таких ситуаций?

Anton Shchukin
вот именно. есть ли какой-нибудь експ по разрешени...

Ну мы написали отдельный сервис, который пишет в Replicated* таблицы идемпотентными вставками. Clickhouse для replicated таблиц делает deduplication последних N вставок при условии, что их контент и порядок данных совпадают.

Anton Shchukin
replicated? может быть replacing?

https://clickhouse.tech/docs/ru/engines/table-engines/mergetree-family/replication/

Anton-Shchukin Автор вопроса
Alexey Churkin
Нет, именно replicated

kafka-key тоже пишется, replicated дал подобного эффекта

Anton Shchukin
kafka-key тоже пишется, replicated дал подобного э...

Ну с replacingmergetree вы вынуждены будете либо следить за дубликатами, делать optimize final, либо переписывать все select-ы

Anton-Shchukin Автор вопроса
Alexey Churkin
Ну с replacingmergetree вы вынуждены будете либо с...

по поводу последнего утверждения доп вопрос: как можно оптимизировать селекты под дюпы?

Anton Shchukin
по поводу последнего утверждения доп вопрос: как м...

Все зависит от вашего профиля нагрузки. Может быть вам и FINAL в селектах подойдет, а может и GROUP BY придется делать в подзапросе.

конечно, это же кафка. Там без дубликатов нельзя.

Anton-Shchukin Автор вопроса
Denny [Altinity]
конечно, это же кафка. Там без дубликатов нельзя.

Хехехе :) А можно попросить более развёрнуто?

Anton Shchukin
Хехехе :) А можно попросить более развёрнуто?

ну в кафке очень тяжело сделать без дубликатов, даже если использовать exactly once -- это не имеет отношения к КХ, это вообще

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта