шарда по 2 реплики создаёт на каждом серврере какие-то бинарники в папках с хостами каждой ноды, и вес этих бинарников больше импортируемого несжатого файла с данными?
Сжатие включено zstd на каждой из 6 нод, был на одну ноду в Distibuted импортирован файл 10G.
root@ch-node-4:/var/lib/clickhouse/data/distributedbd/ppitest_datagate# ls -l
total 144304
drwxr-xr-x 3 clickhouse clickhouse 33476608 Mar 4 05:34 default@192%2E168%2E10%2E129:9000
drwxr-xr-x 3 clickhouse clickhouse 28807168 Mar 4 05:34 default@192%2E168%2E10%2E130:9000
drwxr-xr-x 2 clickhouse clickhouse 27439104 Mar 4 05:34 default@192%2E168%2E10%2E132:9000
drwxr-xr-x 3 clickhouse clickhouse 29003776 Mar 4 05:34 default@192%2E168%2E10%2E134:9000
drwxr-xr-x 2 clickhouse clickhouse 28667904 Mar 4 05:34 default@192%2E168%2E10%2E135:9000
root@ch-node-4:/var/lib/clickhouse/data/distributedbd/ppitest_datagate# du . -hx --max-depth=1 2> /dev/null
4.9G ./default@192%2E168%2E10%2E134:9000
34M ./default@192%2E168%2E10%2E135:9000
5.7G ./default@192%2E168%2E10%2E129:9000
4.6G ./default@192%2E168%2E10%2E132:9000
273M ./default@192%2E168%2E10%2E130:9000
16G .
Решилось установкой параметра internal_replication в true для шард и рестартом серверов. В документации очень блекло написано и сходу непонятно, к чему этот параметр и чем он грозит, когда Destributed пишет в Replicated, пока на практике не столкнёшься...
Обсуждают сегодня