184 похожих чатов

Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree

таблицу . Как результат очень много активных кусков после инсерта, которые со временем (несколько минут) исчезают. Правильным ли подходом будет читать в buffer таблицу ? Смущает ее особенность, когда данные могут потеряться.

13 ответов

18 просмотров

Очень много это сколько? что с партиционированием, какой поток данных

Brаl Brаl-Bral 🏳️‍🌈👠 Автор вопроса
Dmitry [Altinity] Titov
Очень много это сколько? что с партиционированием,...

5-10 тысяч, партиционирования по месяцам. Поток 10-20 мб/с ( сотни тысяч строк) , но читается батчами по 5к, если не ошибаюсь.

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

> , но читается батчами по 5к, если не ошибаюсь. Это что то неправильное, какая версия кх?

Brаl Brаl-Bral 🏳️‍🌈👠 Автор вопроса
Dmitry [Altinity] Titov
> , но читается батчами по 5к, если не ошибаюсь. ...

Не совсем понял. Версия декабрьская 2020 или январская, точно не вспомню .

Brаl Brаl-Bral 🏳️‍🌈👠 Автор вопроса
Dmitry [Altinity] Titov
А какой размер партов который кх создает?

К сожалению , такие подробности не имею возможности уточнить.

Тоже прочитал про буфер-движок и подумал, что он на уровне кх реализует то, что у нас сейчас наша самописеая приложенька делает: читает кафку, раз в 10 сек скидывает батч по 5-20к записей в кх. Но почитав подробней про buffer, понял, что наше решение огонь)) Ну, а вообще 5-10 тыщ партов это овер дохуя

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

настройке в кафка-движке что бы батчи были по 64к дефолтный сеттинг слишком маленький

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

5-10 тысяч в секунду, .., в год? Раз в 7 секунд flush в kafka-engine

Mishanya
настройке в кафка-движке что бы батчи были по 64к ...

дефолтный 1 млн. Там две настройки, сколько poll, и сколько флаш

Brаl Brаl-Bral 🏳️‍🌈👠 Автор вопроса
Denny [Altinity]
5-10 тысяч в секунду, .., в год? Раз в 7 секунд f...

что? раз 1-3 минуты, наблюдается такая нагрузка ~40-50 секунд.

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

Партицирование точно ТОЛЬКО по месяцам? может там какой нибудь PARTITION BY date, clientID ?

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта