Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree

Question

Добрый вечер. Читаем данные из Кафки , пишем в *mergeTree

таблицу . Как результат очень много активных кусков после инсерта, которые со временем (несколько минут) исчезают. Правильным ли подходом будет читать в buffer таблицу ? Смущает ее особенность, когда данные могут потеряться.

#backend #clickhouse #database #devops #programming #russian

0

23.02.2021

13 ответов

31 просмотр

Brаl Brаl Bral 🏳️‍🌈👠 Автор вопроса

Dmitry [Altinity] Titov
Очень много это сколько? что с партиционированием,...

5-10 тысяч, партиционирования по месяцам. Поток 10-20 мб/с ( сотни тысяч строк) , но читается батчами по 5к, если не ошибаюсь.

0

23.02.2021

Dmitry [Altinity] Titov

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

> , но читается батчами по 5к, если не ошибаюсь. Это что то неправильное, какая версия кх?

0

23.02.2021

Brаl Brаl Bral 🏳️‍🌈👠 Автор вопроса

Dmitry [Altinity] Titov
> , но читается батчами по 5к, если не ошибаюсь. ...

Не совсем понял. Версия декабрьская 2020 или январская, точно не вспомню .

0

23.02.2021

Dmitry [Altinity] Titov

Brаl Brаl Bral 🏳️‍🌈👠
Не совсем понял. Версия декабрьская 2020 или январ...

А какой размер партов который кх создает?

0

23.02.2021

Brаl Brаl Bral 🏳️‍🌈👠 Автор вопроса

Dmitry [Altinity] Titov
А какой размер партов который кх создает?

К сожалению , такие подробности не имею возможности уточнить.

0

23.02.2021

Pavel

Тоже прочитал про буфер-движок и подумал, что он на уровне кх реализует то, что у нас сейчас наша самописеая приложенька делает: читает кафку, раз в 10 сек скидывает батч по 5-20к записей в кх. Но почитав подробней про buffer, понял, что наше решение огонь)) Ну, а вообще 5-10 тыщ партов это овер дохуя

0

23.02.2021

Mishanya

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

настройке в кафка-движке что бы батчи были по 64к дефолтный сеттинг слишком маленький

0

23.02.2021

Denny [Altinity]

Brаl Brаl Bral 🏳️‍🌈👠
5-10 тысяч, партиционирования по месяцам. Поток 10...

5-10 тысяч в секунду, .., в год? Раз в 7 секунд flush в kafka-engine

0

23.02.2021