одному ключу, эту таблицу нужно репартицировать по другому ключу
С какими подводными могу столкнуться,
если создам вторую таблицу с другим ключом партицирования и наполню ее вот так:
insert into t2
select * from t1
или это норм практика?
норм. если ожидаете что долго, можете по кускам вставлять (по дням или ещё что). в новых версиях вставка параллелизована, проблемы быть не должно. можно получить too_many_parts, это можно через SETTINGS parts_to_delay_insert=bignumber, parts_to_throw_insert=bignumber игнорировать
Ну еще можно убыстрить через max_insert_threads=(что-то больше 1), но оно будет сильно память есть тогда
а можно поинтересоваться какой PARTITION BY ... на какой PARTITION BY меняете?
просто строку(группа пользователей) на дату совершения события
да дата лучше обычно но если данных не триллионы то лучше toYYYYMM(event_date) чем toYYYYMMDD(event_date) парты больше получатся
Обсуждают сегодня