Можете сделать пример и issue на гитхабе без зависимости от данных? Какие нибудь селекты из system.numbers limit 10.
а какая задача? Сравнивать без контекста странно. В Яндекс.Облаке есть облачные инсталляции ClickHouse с админами и саппортами. Можно кинуть им письмо на сравнение по деньгам....
в preprocessed_configs проверяете? препроцессед перенесли в папку начиная с какой-то вресии. Проверил, при рестарте на master-е подепляется изменение конфига Update: вы видим...
В вашей in-house DB данные хранятся честно или предаггрегированными? В CH есть SummingMergeTree для последнего сценария. В частности вы можете настроить materialized view из о...
это по новым данным или с учетом мержей старых? старые пожатые куски же разом не поменяются от изменения кодека у колонки - потребуется время на рассосаться (пока все пережмет...
можете попробовать настройку min_insert_block_size_rows, но вероятно у вас что-то не так со схемой: не плодите там миллионы партиций случайно для A?
В выводе пишет any inner? Замените на semi left
два варианта: 1 поломались счетчики памяти (такое было когда-то), 2 какой-то запрос хочет очень много памяти. если проблема на конкретном запросе. сам запрос можете дать?
а ODBC куда ходит?
а на сервере хватает места для создания новых кусков нужного размера? посмотрите еще в системных таблицах select * from system.mutations - там должны быть причины фэйла если е...
какой engine? select показывает расхождение в данных? возможно куски смержились, вместо несколькоих старых появились новые, большего размера. Или более доугие, в зависимости о...
из документации "При остановке сервера, при DROP TABLE или DETACH TABLE, данные из буфера тоже сбрасываются в таблицу назначения." Или имелось в виду что-то другое?
что вы пордазумеваете прод update-ом? можно создать рядышком таблицу результат джойна и потом их подменить DDL-ками
на шарде с проблемами совсем нет данных в этой колонке? или часть есть? сами файлы на месте? можно попробовать сделать detach партиции + аттач с соседнего шарда
а с точностью до партиции можем локализовать? выглядит более вероятным, что данные побились/помержились на шарде неправильно, а не прилетели разными
а зачем вам партиционироваться по второму полю? Проще добавить его в начало ключа сортировки внутри парта (если речь про ускорение селекта)
По не uuid джойнит? Там не все hash функции в engine join поддерданы - может быть еще из-за этого
Можете посмотреть с enable_debug_queries=1; analyze <запрос с джойнами> - где отличие от того, что пишете руками?
Какая из колонок nullable? join_use_nulls = 0 не лечит? Запрос из локального клиента проходит?
можем вставить в такую же табличку одну строку с uuid, вторую без uuid и сделать по ним те селекты, которые выше?