UInt32, LO_SUPPKEY UInt32, LO_ORDERDATE Date, LO_ORDERPRIORITY LowCardinality(String), LO_SHIPPRIORITY UInt8, LO_QUANTITY UInt8, LO_EXTENDEDPRICE UInt32, LO_ORDTOTALPRICE UInt32, LO_DISCOUNT UInt8, LO_REVENUE UInt32, LO_SUPPLYCOST UInt32, LO_TAX UInt8, LO_COMMITDATE Date, LO_SHIPMODE LowCardinality(String), C_NAME String, C_ADDRESS String, C_CITY LowCardinality(String), C_NATION LowCardinality(String), C_REGION LowCardinality(String), C_PHONE String, C_MKTSEGMENT LowCardinality(String), S_NAME String, S_ADDRESS String, S_CITY LowCardinality(String), S_NATION LowCardinality(String), S_REGION LowCardinality(String), S_PHONE String, P_NAME String, P_MFGR LowCardinality(String), P_CATEGORY LowCardinality(String), P_BRAND LowCardinality(String), P_COLOR LowCardinality(String), P_TYPE LowCardinality(String), P_SIZE UInt8, P_CONTAINER LowCardinality(String)) ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/default.lineorder_flat_rep', '{replica}') PARTITION BY toYear(LO_ORDERDATE) ORDER BY (LO_ORDERDATE, LO_ORDERKEY) SAMPLE BY LO_ORDERKEY SETTINGS index_granularity = 8192
спасибо Денис. Семплированая репликейтед таблица я так понимаю что distributed таблицу семплировать не надо?
ip-172-31-87-13.ec2.internal :) select version();
SELECT version()
┌─version()─┐
│ 20.1.4.14 │
└───────────┘
кстати SAMPLE BY LO_ORDERKEY -- это неправильно. Ключ семплирования должен использовать все пространство чисел. На первую реплику будет послано <= MAXINT/2 на вторую > MAXINT/2 ORDER BY ...., cityHash64(LO_ORDERKEY)) SAMPLE BY cityHash64(LO_ORDERKEY)
Обсуждают сегодня