Подскажите может есть у кого опыт. Есть большой кластер КХ (100

Question

Подскажите может есть у кого опыт. Есть большой кластер КХ (100

шардов), в него пишу независимо в каждый шард определенный поток данных (шардирую на стороне клиента), движек таблицы ReplicatedMergeTree, вставляю в несколько потоков, на каждый шард приходится 4-5 вставляющих потоков, вставка каждым потоком происходит не чаще раз в 1 секунду относительно крупными кусками (10-20мб), иногда проскакивают дубли (при недоступности шарда, или пересоздания потока). Есть у кого какие рецепты как этих дублей избежать? (знаю что есть очередь дедубликации, она выкручена на шардах в 1000). В данных есть колонки специально завезенные для дедубликации.

#backend #clickhouse #database #devops #programming #russian

0

17.09.2019

1 ответов

40 просмотров

Vitaly · Accepted Answer

Vitaly

А как ты понимаешь что дедупликация не работает? Смотришь на данные?

0

17.09.2019

184 похожих чатов

Подскажите может есть у кого опыт. Есть большой кластер КХ (100

1 ответов

Похожие вопросы