данные? С учётом ретроспективной последовательности или при удалении одной будет нарушение целостности данных, кто знает?
Не будет нарушения целостности. Команды alter attach/detach/drop даже могут выполнять эти операции для отдельных партов. См. https://clickhouse.com/docs/ru/sql-reference/statements/alter/partition/
К сожалению документация не даёт ответа на мой вопрос... Под нарушением целостности данных я понимаю удаление в парте более свежих кусков данных с сохранением более старых данных в других партах - нарушение ретроспективности их попадания в БД
Я не очень понимаю ваш вопрос. Вы не доверяете записанным метаданным таблицы? Вы сделали запрос в таблицу system.parts. Получили список всех партов для базы/таблицы, у которых max_date старше вашей даты. Дальше можно для них выполнять alter table detach/drop. Есть вероятность, что за время между запросом списка этих партов и их удалением могут появится новые парты, которые попадают под ваше условие. В каком случае это может произойти? Я вижу только два. 1. У вас в базу прилетают записи с датой в прошлом. Случается ли так, об этом можете знать только вы. 2. Выполняются слияния с целью объединения партов в бОльших кусок. Не актуально для старых партиций, только для текущей. Если вы хотите удалять самые старые данные из активной партиции(партиции, в которую идёт запись) то можно на время запуска скрипта остановить слияния для вашей таблицы(system stop merges tablename...), а потом их снова запустить. Но у этого, я так понимаю, может быть некоторое пенальти на чтение данных из самых свежих кусков Вы не ответили на мой вопрос, что болезенненного в том, чтобы удалять целую партцию? Если у вас какой-то специфический кейс, в котором это так, то можно также рассмотреть опцию уменьшения размера партции с недельной до суточной(посмотреть, не приведёт ли это к ухудшению компрессии данных, например)
Обсуждают сегодня