184 похожих чатов

Подскажи плз, а какими батчами лучше вставлять данные в КХ,

если, например, вставка происходит с нескольких процессов. Сейчас пишется по 2.5+- млн записей / N процессов. Пробовал уменьшать/увеличивать размер батча или колич-во процессов, но их прямую зависимость к общей скорости процесса загрузки данных особо не заметил.

Могу ли я как-то ускорить процесс загрузки данных на уровне КХ, при этом имея максимально возможно оптимальное число процессов, или нужно как-то изменять текущую архитектуру - добавить брокера нужно мб, чтобы параллельные записи в КХ уменьшить? Записи происходят в одну таблицу движка MergeTree.

4 ответов

12 просмотров
Дмитрий-Шепелев Автор вопроса

Да, ещё хотел бы уточнить, что это всё происходит на одной машине. То есть, может быть, нужно уменьшить колич-во N, чтобы кх успевал вставлять данные быстрее

В диск не упираетесь?

оно все равно в итоге бьется по блокам в 1 048 000 записей в одном коннекте ( https://clickhouse.tech/docs/en/operations/settings/settings/#settings-max_insert_block_size ) загрузка упирается в кол-во одновременных тредов вставки и то как они утилизируют IO / CPU (сортировка по PK) можно размер блока увеличить можно с алгоритмами сжатия и составом Primary Key в таблице

параллелится, 6 ядер -> 6 заливок , примерно в 6 раз быстрее

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
61
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Всем привет! поделитесь, пож-та, как кто дебажил / решал проблему с 504 Time out ошибкой от nginx, когда стучишься на свой vapor сервер? в логах /var/log/nginx/error.log е...
Paul
24
Привет всем. Не знаю, удачный ли чатик я выбрал для вопроса, но он как будто в целом про концепцию фп и конкретно про Haskell. Прочитал, что в целом в мире фп нет идеи мутабел...
Gellert Cringewald
15
Как добавить ссылку в Быстрый доступ в Проводнике windows 10? Нашёл, как на power shell сделать, но может есть способ через Дельфи?
А
31
@helgispbru @Dreamer_0x01 @Pathologic93 @webber_12 Не уверен, что вам всем это жутко интересно, но в продолжение недавнего диалога отправлю свои наброски. Хочу понять, правил...
Андрей [aharito] Харитонов
13
Карта сайта