как:
- https://github.com/nikepan/clickhouse-bulk
- https://github.com/bytadaniel/clickcache
актуальны ли эти пакеты, и существует ли необходимость в сортировке и группировке строк в чанки вне кх, если учитывать существование фичи aync_insert?
https://clickhouse.com/docs/en/cloud/bestpractices/asynchronous-inserts
Умеете в async_insert используйте его Самый л сущий вариант с самого начала буфер на стороне приложения и вставки батчами от 100k или не чаще раза в секунду
Понял, получается, актуальны Получается, что async_insert медленнее работает, что ли?
Нет Не медленней Просто если у вас скажем 200 вставок в секунду по одной записи То получите в async_insert все равно мелкие парты которые потом merge background должны пройти И плюс ещё все равно надо тюнить настройки чтобы не упираться в 100 одновременныхзапросов
async_insert же ждет пока вставится (по умолчанию 200мс), если у вас 100 (1000) источников инсертят, то это ок, если 1 то придется мутит многпоточность, т.е. проще батчи делать и не использовать async_insert
Обсуждают сегодня