у вас в кластере. То что данные разного размера - ни о чем не говорит. Далее, вставлять в буфер, который смотрит на distributed - я бы не стал. В доке написаны все ограничения и возможные проблемы https://clickhouse.tech/docs/ru/operations/table_engines/buffer/
И ещё, в таблице default.raw - вам точно нужны такие PARTITION BY и ORDER BY?
Чем меньше колонок там - тем лучше, порядок и кардинальность тоже важны. Например зачем в ORDER BY FileTimeStamp? У вас большая часть запросов по нему чтоли?
Спасибо, проверю данные. По FileTimeStamp и FilePosition сверяем, вставились ли данные. Поскольку транзакционности нет, а нужно как-то контролировать вставку, то не придумали ничего лучше. Про проблемы почитаю, спасибо.
Обсуждают сегодня