184 похожих чатов

Всем привет! Помогите, пожалуйста, разобраться с бэкапами в случае, когда

данные находятся в S3. Использую clickhouse-backup. После создания бэкапа, когда забэкапленый парт полностью удаляется из Кликхауса, его файлы в S3 всё равно остаются. Это логчино, иначе как восстанавливать? Но после удаления бэкапа эти файлы всё так же остаются в S3. Что-то никак не разберусь как эти файлы удалять. Или это так и задумано?

7 ответов

51 просмотр

вы имеете ввиду s3 disk? https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/mergetree/#table_engine-mergetree-s3 ? или чистый *MergeTree и remote_storage: s3 в clickhouse-backup ?

Ivan-Merzlyakov Автор вопроса
Slach [altinity]
вы имеете ввиду s3 disk? https://clickhouse.com/do...

Таблица ReplicatedReplacingMergeTree. S3 используется как один из дисков в роли холодного хранилища. Данные туда по TTL переносятся. Без бэкапов, в случае мерджа партов, которые в момент мерджа уже лежат в S3, файлы этих партов корректно удаляются после того, как они смерджились. Но если создать бэкап, файлы таких партов не удаляются после мерджа. Если я правильно понял, на это влияет freeze partition, который делает clickhouse-backup. Проблема в том, что если бэкап удалить, то файлы уже не существующих партов так и остаются в s3. Ссылок на них нигде не видно. Но может я всё-таки что-то упускаю?

Ivan Merzlyakov
Таблица ReplicatedReplacingMergeTree. S3 использу...

при бекапе s3 дисков в clickhouse-backup бекапятся на самом деле локальные файлы в которых ничего нет кроме имен файлов на s3 при восстановлении именно эти файлы восстанавливаются s3 не трогается парты иммутабельны

Ivan Merzlyakov
Таблица ReplicatedReplacingMergeTree. S3 использу...

нет не упускаете, clickhouse-backup к сожалению не сможет дотянуться до исходных данных в s3

Ivan-Merzlyakov Автор вопроса
Slach [altinity]
нет не упускаете, clickhouse-backup к сожалению не...

Ага, идея ясна. Спасибо! На всякий случай последний вопрос. Я правильно понимаю, что при удалении бэкапа можно пройтись по всем партам, которые есть в этом бэкапе, убедиться что конкретный парт отсутствует в остальных бэкапах и осутствует в таблице system.parts и этого будет достаточно чтобы безбоязненно удалять файлы из S3? Ссылки на S3 внутри в явном виде лежат, поэтому вопрос о том что именно удалять не стоИт.

Ivan Merzlyakov
Ага, идея ясна. Спасибо! На всякий случай последни...

да, перед удалением, придется перечитывать все backup_name/metadata/db/table.json во всех бекапах потом скачать данные пройтись локально по shadow и удалить из s3 может быть в 2.0.0 сделаем это автоматически, надо подумать как просто такое удаление может быть долгим бегать по десяткам тысяч файлов в s3

Ivan-Merzlyakov Автор вопроса

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта