2 поля, PARTITION BY (toYYYYMM(EventDate),type), создается “очень много” партиций, настолько много, что я даже wc -l сделать немогу - система в ступор уходит. Кликхаус становится очень не “отзывчивым” при чтении или вставке, со временем (примерно после вставки 40g данных) - любая операция мержа занимает минуту-две-три. В поле type не так уж много вариантов - 10. в EventDate - 1 месяц. Если делать 1 ключ -toYYYYMMDD(EventDate) - все работает отлично - уже порядка 3 миллиардов строк 200G данных за несколько месяцев, и все достаточно шустро обрабатывается. В чем может быть косяк?
Например, каждый insert относится ко множеству партиций, создается множество партов и они не успевают мерджиться
Обсуждают сегодня