по дням по полю Date, исходя из того, что наиболее часты выборки за текущие сутки. Но, с учётом хранения данных более года, количество партиций большое и, если правильно понимаю, запрос данных за две недели (месяц) должен быть заметно дольше?
При запросах делается чтение из всех партиций, которые указаны в WHERE. Соответственно, в худшем случае, если данные не в кэше, то чтение из 100 партиций приведет к N*100 случайных чтений, где N — число колонок, участвующих в запросе
Там еще сортировка роль играет. В любом случае партиции по дням для сильно специфичных случаев. Попробуйте хотя бы нелели, а лучше месяцы.
Обсуждают сегодня