184 похожих чатов

Коллеги, привет! Помогите пожалуйста с записью из КХ (managed, 3шарда) в

S3 в яндекс облаке

В КХ есть raw табличка, которая наполняется трансфером в режиме репликации (стриминг)
Данных довольно много, хранить все в КХ дорого.
Хочу переливать историю в S3, а на самом КХ хранить, допустим, только 3 месяца, не суть

Вопрос:
Как можно писать на S3, чтобы при этом ничего не хранилось в самом КХ?
При этом, чтобы потом с этого S3 я мог прочитать (хотя бы спарком).
В идеале еще бы, чтоб при надобности можно было обратно этот S3 прочитать из КХ и сделать какой-то запрос

Почитал про S3 движок, но я не очень понял, как он работает.
Выглядит так, как то, что он в первую очередь для чтения данных из S3, а не для записи в S3.
А мне же в первую очередь записать, чтобы хранить все в виде файлов, а не в КХ.
Какие могут быть варианты, если не этот движок? Или может я про этот движок что-то неправильно понял?

Буду благодарен, если подскажете пайплайн

Спасибо!

9 ответов

36 просмотров

Если верить Гуглу Яндекс должен уметь такое из коробки

объвляешь диск s3, и можно настроить перекладываение исторических данных туда. селекты с с3 тоже работают, в разы медленнее чем локальный диск конечно. но для исторических данных мне хватало

В managed ch нужно включить опцию "Гибридное хранение" в настройках, потом навесить TTL на таблицу

Vitalik- Автор вопроса

т.е. после TTL он не удалется, а просто переходит в S3? Но при этом селектить его можно, просто будет медленнее? А это какой-то подкапотный S3 доступный только для КХ, или к нему есть доступ?

all ow
В managed ch нужно включить опцию "Гибридное хране...

а разве ttl а не disk policy регулируются диски? последний раз такое года 3 назад насраивал, не помню уже

Vitalik
т.е. после TTL он не удалется, а просто переходит ...

ну нужно прописать TTL на перенос в S3, а не удаление) да, можешь прописать, чтобы данные больше 3мес переносились в S3. Это под капотом.

dslimp
а разве ttl а не disk policy регулируются диски? п...

Яндекс это берет на себя, там просто прописываешь так после включения опции MODIFY TTL event_time + INTERVAL 60 DAY TO DISK 'object_storage';

dslimp
а разве ttl а не disk policy регулируются диски? п...

хотя возможно, если хочешь чтобы всё было на S3 можно и disk policy указать при создании таблицы, тут не подскажу

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта