184 похожих чатов

Приветствую. Нужен совет по архитектуре. На текущий момент имеется только

одна нода ClickHouse, расположенная в Европе. И несколько сервисов географически отдаленных на разных континентах, которые напрямую пишут в ClickHouse. Проблемы (commit error: driver: bad connection) возникают, когда происходит потеря пакетов между клиентом и сервером. Потери происходят где-то в интернете, поэтому, насколько я понимаю, на это нельзя никак повлиять.

Первая идея была - при ошибке записи делать дамп локально на диск и пробовать записать его позже. Прикрутил https://github.com/nikepan/clickhouse-bulk, но при высоких нагрузках он себя плохо проявил.

Сейчас думаю над тем, чтобы:
* cделать ClickHouse кластер и расположить ноды поближе к клиентам. Но предполагаю, что из-за той же потери пакетов сами ноды могут плохо синхронизироваться.
* или писать в промежуточное хранилище (Apache Kafka) и потом выгребать из него в ClickHouse.

Подскажите, как лучше поступить в данной ситуации?

2 ответов

2 просмотра

писать в промежуточное хранилище (Apache Kafka) и потом выгребать из него в ClickHouse.

может уже дали ответ, но как то мельком посмотрел и не заметил. для геокластера используйте надёжный транспорт: rabbitmq (shovel), rsync (немного кастома), p2p (много кастома). т.е. региональные ноды пишут в rmq/ в файлик, данные прилетают в центральную точку и там записываются. кафка afaik не умеет в гео-кластере работать. да и напрямую, через интернет писать не стоит. по размещению реплик в регионах не подскажу - вроде бы нужен единый зукипер, а ему нужна хорошая сеть. rmq много сообщений в секунду не пропустит (1-10к qps), но в одно сообщение можно паковать массив бизнесовых эвентов и пропускная способность будет 1-10к * размер массива. мы так из азии в европу в рамках геокластера гнали статистику на скорости более 10к/с

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
@FAssembler ты много с формами работал, как цикл обработки сообщений от окошек надо делать, чтобы IsDialogMessage не ломал ввод в эдиты и навигация по табам работала?
The Bird of Hermes
8
Карта сайта