184 похожих чатов

Всем привет! Недавно обнаружили, что после вставки большой пачки через

clickhouse-client в редких случаях встречаем странное поведение. А конкретно - пачка вставляется, но вставщик получает ошибку по таймауту, дальше срабатывает уже самописная логика где идёт перевставка пачки снова. Это ведет к дублям данных. Выглядит это так:
insert_error=$(cat $ FILE | clickhouse-client --receive_timeout=180 --send_timeout=180 --host $CH_HOST -u $CH_USER --password $CH_PASSWORD --port $CH_PORT 2>&1)
STATUS=$?
if [ $STATUS -eq 0 ]; then
отстук метрики
else
вставляем снова через 180 секунд
fi
В штатном режиме пачки хоть и больше ляма строк, но вставляться за минуту успевают в большинстве. Исключение составляют затупы сети, либо зукипера, либо самого клика.
Можно ли эту проблему обойти каким то образом? Почему клик может не отдавать успешный статус код, если он вставил пачку? Или это баг и нужно открывать тикет на гитхабе? Это пограничные неприятные случаю из-за которых приходиться мутации вызывать с удалением данных.
Вот пример ошибки в таким моменты:
Code: 209. DB::NetException: Timeout exceeded while reading from socket (159.69.160.212:9000): while receiving packet from 150.60.150.210:9000
Версия сервера - 22.2.2.1
Версия клиента - 21.2.2.8

14 ответов

12 просмотров

главное правило вставки - не расчитывать что ваша вставка пройдёт, ибо никаких гарантий клик не даёт и дубли это частое явление поэтому мы например всегда пишем через промежутучную таблицу а потом просто партицию копируем если вствка прошла

Илья-Максимов Автор вопроса
Konstantin Ilchenko
главное правило вставки - не расчитывать что ваша ...

Клик не даёт гарантий вставки если она асинхронная, у нас же проставлен параметр ожидать вставки пачки во все реплики и оно работает в 99% случаев. Но раз в пару месяцев стреляет неприятно

Илья Максимов
Клик не даёт гарантий вставки если она асинхронная...

если синхронная - тоже никаких гарантий. Если у вас большая пачка вставляется, часть данных может вставиться, а часть упадёт тут вот можете поиграться с настройками для атомарной вставки https://kb.altinity.com/altinity-kb-queries-and-syntax/atomic-insert/#insert-with-adjusted-settings-atomic

Konstantin Ilchenko
если синхронная - тоже никаких гарантий. Если у ва...

Ну всмысле, если клику ты отдал данные, а он тебе ответил ок, это разве не гарантия?

Константин
Ну всмысле, если клику ты отдал данные, а он тебе ...

если ОК вернул, то всё хорошо, но ретраить вставку если была ошибка - плохая идея обычно)

Konstantin Ilchenko
если ОК вернул, то всё хорошо, но ретраить вставку...

Но ведь, он сохраняет хэш последних вставок и если ты ретрайнишь, то в теории он может понять, что это одно и тоже и не вставить

Константин
Но ведь, он сохраняет хэш последних вставок и если...

для этого надо одинаковыми блоками вставлять, иногда это тяжело повторить

Илья-Максимов Автор вопроса
Konstantin Ilchenko
если ОК вернул, то всё хорошо, но ретраить вставку...

Дык а как тогда манажить вставкой, если произошла ошибка? Руками идти смотреть system.query_log?

Илья Максимов
Дык а как тогда манажить вставкой, если произошла ...

мы исходим из самого плохого варианта, часть данных вставилась поэтому вставка в таблицу tmp со структурой такой же как и в основной таблице truncate table tmp insert into tmp alter table main attach partition from tmp если что-то идёт не так при вставке, мы просто ретраим, таблица затранкейтится и дуюлей не будет

Илья-Максимов Автор вопроса
Konstantin Ilchenko
мы исходим из самого плохого варианта, часть данны...

понял, в моём случае одновременно работают 10+ вставщиков, поэтому не уверен что такая схема прокатит, но на карандаш идею взял, спасибо

Илья-Максимов Автор вопроса
Konstantin Ilchenko
мы исходим из самого плохого варианта, часть данны...

Кстати. А как текущая схема спасает когда "часть данных вставилась"? Вот прошла чистка, вы вставили пачку, а там 50% дошло и вставилось, далее аттач?

Похожие вопросы

Обсуждают сегодня

Типа вызывать GetParent и проверять на соответствие GetModuleHandle?
The Bird of Hermes
67
Всем привет! Кто нибудь парсил в ручную JSON без библиотек и фреймворков? Есть может ссылки на оптимальный алгоритмы работы с текстом и примеры таких парсеров?
Lem
27
Do any of you guys have interesting projects one could join? I'm a Middle Full-Stack developer (JS/TS, React & Node)
Lev Shapiro
40
Есть сайт. Там была древняя версия эво. Стоял плагин, который каждый коммент в Jot делал отдельной страницей. После обновления все слетело, теперь старница открывается отдельн...
Artem
1
$res = json_decode($наша строка из респонса); $res1 = array_map(fn($o) => $o->name, $res->breadcrumbs[0]->entities); Как такое будет на Хаскеле?.. В начале весь джейсон, в ко...
Хаскель Моисеевич Гопник
27
Добрый день. А shovel'ы можно как-то сконфигурировать в definitions.json? Пробовал что-то вроде: { "users": [ { "name": "agent", "password_hash": "RBCbTzQd...
Aleksey
1
Вопрос по диагностике ошибок (я знаю в чем, в данном конкретном примере, я знаю, как исправить, пример модельный, понятно, что в реальности бывает намного запутаннее). module...
ⰄⰎⰋⰐⰐⰑⰛⰤⰧⰧⰩⰄ ⰊⰑⰁⰓⰡⰛⰦⰕⰫ
11
А чем вам питонисты не угодили?😂
.
79
В чем сила брат, в NASM или FASM?
Isaac Kleiner
18
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
52
Карта сайта