engine=Log
созданные и еще не дропнутые с версии 20.4 читаются в несколько тредов (insert-select ~1m rows ~19sec)
а созданная в 20.12 почему-то ломится в 1 тред (и в 2-3 раза дольше обрабатывается)
насильно пытаюсь увеличить (
set max_threads = 6;
set min_insert_block_size_rows=200000;) - не помогает - видимо чего-то не учел?
Странно это. А просто селект тоже в 1 поток?
Когда таблицу log заполняю с min_insert_block_size_rows=200000 То на селекте в формат нулл можно добиться того, чтобы было несколько тредов Но чтобы и на инсерты позитивно повлияло - не заборол пока
max_insert_threads можно попробовать увеличить, если еще не делали https://github.com/ClickHouse/ClickHouse/search?q=max_insert_threads
Так у вас вставка не параллелится? Я думал селекты. По вставке insert_select куча параметров есть которые надо смотреть.
В лоб пробовал - не спасло
А есть где-то в сконцентрированом виде список? А то разрозненно натыкался на разные, а полной картины не сложил в голове
т.е. разница в том как создается engine=Log , одним блоком или несколькими. Откуда берутся эти engine=Log ? каким запросом?
create ttt as prototype_table engine=Log потом шелл zcat file | clickhouse-client -q"insert into ttt format CSV"
ну например так --max_insert_block_size=10000 --input_format_parallel_parsing=0 zcat file | clickhouse-client --max_insert_block_size=10000 --input_format_parallel_parsing=0 -q"insert into ttt format CSV"
спасибо, пробую на последующий ЕТЛ-ьный запрос к этой таблице насильно какие-то сеттинги надо добавлять? или само должно понять?
тредов стадо больше (~6) но к скорости последующей выборки плюсануло не так сильно, как я надеялся [hostname] 2021.01.13 15:01:57.683883 [ 2607564 ] {f1e730ce-c8f9-429c-a8b5-d957fdc1f27f} <Information> executeQuery: Read 1624753 rows, 1.35 GiB in 28.547938887 sec., 56913 rows/sec., 48.38 MiB/sec. [hostname] 2021.01.13 15:01:57.684423 [ 2607564 ] {f1e730ce-c8f9-429c-a8b5-d957fdc1f27f} <Debug> MemoryTracker: Peak memory usage (for query): 3.32 GiB. получается что-то из дефолтных сеттингов решило вести себя иначе Спасибо @den_crane
ну сделайте тикет на гитхабе что регресия перфоманса, приложите статистику, было так, стало так
Обсуждают сегодня