по 2 реплики на каждой шарде. Проблемы начались пару дней назад после падения всех зукиперов .
Сейчас наблюдаем такие показатели в очередях
shard 02 rep1
database─────┬─table───────────────────┬─zookeeper_path───────────────────────────────┬─queue_size─┬─inserts_in_queue─┬─merges_in_queue─┬─absolute_delay─┐
│ by_adv_stats │ .inner.cpc_products_ctr │ /clickhouse/tables/02/by/cpc_products_ctr │ 54071 │ 51320 │ 2751 │ 290718 │
│ kz_adv_stats │ .inner.ads_total_stats │ /clickhouse/tables/02/kz/ads_total_stats │ 27486 │ 27486 │ 0 │ 290706 │
│ kz_adv_stats │ .inner.cpc_products_ctr │ /clickhouse/tables/02/kz/cpc_products_ctr │ 28044 │ 28044 │ 0 │ 290706 │
│ kz_adv_stats │ currency_rate_shard │ /clickhouse/tables/02/kz/currency_rate_shard │ 1 │ 1 │ 0 │ 172938 │
│ kz_adv_stats │ events_shard4 │ /clickhouse/tables/02/kz/events_shard4 │ 29041 │ 29041 │ 0 │ 290706 │
│ ru_adv_stats │ .inner.ads_total_stats │ /clickhouse/tables/02/ru/ads_total_stats │ 4479 │ 4232 │ 247 │ 290703 │
│ ru_adv_stats │ .inner.cpc_products_ctr │ /clickhouse/tables/02/ru/cpc_products_ctr │ 37987 │ 37884 │ 103 │ 290703 │
│ ru_adv_stats │ click_shard │ /clickhouse/tables/02/ru/click_shard │ 8558 │ 8325 │ 233 │ 290748 │
│ ua_adv_stats │ .inner.ads_total_stats │ /clickhouse/tables/02/ua/ads_total_stats │ 49261 │ 49243 │ 18 │ 290715 │
│ ua_adv_stats │ .inner.cpc_products_ctr │ /clickhouse/tables/02/ua/cpc_products_ctr │ 56256 │ 55504 │ 752 │ 290715 │
│ ua_adv_stats │ click_shard │ /clickhouse/tables/02/ua/click_shard │ 41 │ 33 │ 8 │ 1623292 │
│ ua_adv_stats │ currency_rate_shard │ /clickhouse/tables/02/ua/currency_rate_shard │ 1 │ 1 │ 0 │ 86600 │
└──────────────┴─────────────────────────┴──────────────────────────────────────────────┴────────────┴──────────────────┴─────────────────┴────────────────┘
shard 02 rep2
─database─────┬─table───────────────────┬─zookeeper_path────────────────────────────┬─queue_size─┬─inserts_in_queue─┬─merges_in_queue─┬─absolute_delay─┐
│ by_adv_stats │ .inner.cpc_products_ctr │ /clickhouse/tables/02/by/cpc_products_ctr │ 1 │ 1 │ 0 │ 28881 │
│ kz_adv_stats │ events_shard4 │ /clickhouse/tables/02/kz/events_shard4 │ 10778 │ 9440 │ 1338 │ 1361030 │
│ ru_adv_stats │ click_shard │ /clickhouse/tables/02/ru/click_shard │ 10 │ 10 │ 0 │ 48766 │
└──────────────┴─────────────────────────┴───────────────────────────────────────────┴────────────┴──────────────────┴─────────────────┴────────────────┘
shard 01 rep1
пусто
shard 01 rep2
┌─database─────┬─table───────────────────┬─zookeeper_path────────────────────────────┬─queue_size─┬─inserts_in_queue─┬─merges_in_queue─┬─absolute_delay─┐
│ ru_adv_stats │ .inner.cpc_products_ctr │ /clickhouse/tables/01/ru/cpc_products_ctr │ 5471 │ 5420 │ 51 │ 54093 │
все хосты кроме shard 02 rep1 перегружались и некторые таблицы не могли подняться , помогало только добавление флага flags/force_restore_data 1 в зукиппер
вопрос что делать с очередями , что бы они разгреблись ?
в логах КХ ошибки
<Error> InterserverIOHTTPHandler: Code: 232, e.displayText() = DB::Exception: No part 20190312_20190312_25581_25581_0 in table,
В таблице system.replication_queue можно посмотреть на конкретные записи в очереди репликации - должна быть написана причина, почему они не обрабатываются.
Обсуждают сегодня