локальные таблицы, а только потом Distributed.
Почему: дело в том, что после вставки в Distributed таблицу, заполняются все столбцы, которые в ней есть, включая свежедобавленный. Затем этот блок данных отправляется дальше для вставки в локальные таблицы, где нового столбца ещё нет. Эта вставка не проходит, и Distributed таблица пытается её повторять.
При этих повторах должна срабатывать дедубликация данных. Почему не сработала? Есть разные варианты - возможно, используются столбцы с rand() или now() значением по-умолчанию или что-то в этом роде. Также может быть некоторые идеи знает @vludv
Хотя вы вставляете в локальные таблицы напрямую, значит тут другое.
Спасибо, да слона мы и не заметили что-то ) Еще вопрос, а метрика перешла на 1.1.54327 в проде - хотим обновлять кластер - можно ? ))
@garikanet Я могу объяснить появление дублей, если у вас в логе помимо ошибок "There is no column with name D" еще будут "Unexpected error while adding block". У вас есть такие? Да, и т.к. вы вставляете напрямую, Distributed таблица тут ни при чем.
Подскажите, пожалуйста, можно ли менять число повторов на вставку Distributed таблицей?
Обсуждают сегодня