нажатии чекбокса будто бы не дофига новых вещей нужно настроить.
т.е., насколько я понимаю, положить свой адрес бакета, куда хочешь, чтобы это складывалось - нельзя.
А если у меня уже есть бакет, и хотелось бы писать именно в него?
Это возможно?
мин.доля - это move_factor. то есть, если ставишь 0.1, то если диск забьется на 90% - Яндекс будем сам переносить парты в s3. свой бакет я думаю, что нельзя, так как не понятно зачем. Но лучше уточни у поддержки) Парты с S3 обратно на диск ты сможешь переносить и так.
Спасибо! Прости, можешь объяснить последнее предложение, что имеешь в виду?
что данные, которые у тебя в S3 будут, их можно будет переместить обратно на SSD, если возникнет такая необходимость.
Понял, то есть это не подкапотным "планировщиком" определяется, а по сути физически. Тогда, если я правильно понял, механизм такой: Допустим, у меня таблица партиционирована по дням (данных за12 месяцев, TTL = 3 месяца) (кстати, непонятно как это для непартиционированных таблиц определяется. Ведь настройка одна на весь кластер) И при достижении каких-то условий партиция (самая старая) просто физически переносится в S3. т.е. в селекте с кластера больше вообще не участвует никак (ни в медленном, ни в каком) И если мне вдруг надо, то я: 1) либо делаю еще одну S3-engine таблицу, чтобы читать напрямую с S3 те партиции, которые уже там, и в финальном селекте делаю, например, union, с теми 3мя месяцами, что я получил с кластера, чтобы получить весь год 2) либо как-то освобождаю место, и физически ее копирую обратно на кластер, аттачу к таблице и селекчу
не понял про S3 engine таблицы, они не нужны вообще. TTL задается как глобально - это move factor. Он сам начнет парты перемещать при достижении 90% заполненности диска, но лучше до этого не доводить, а контролировать самому с помощью TTL на таблицы. и либо как в твоем случае, на таблицу, синтаксис выше. Таблицы обычные MergeTree. У тебя обычная таблица MergeTree, просто часть данных будет лежать на SSD, часть в S3. КХ сам сходит в S3, если запросишь даннные больше 3х месяцев например.
Угу, понял. Если КХ сам может и туда и туда пойти, то да, s3engine не нужна
я вообще три диска настраивал - первый ссд, последние данные, второй крупный рейд, на hdd, и треий - уже s3 amazon)
ага, вот прочитай небольшую статью, тут весь синтаксис и краткое описание что к чему от Kazan Express. https://cloud.yandex.ru/blog/posts/2022/11/clickhouse-kazanexpress
то есть cold, hot, warm грубо говоря) ну это on-prem, managed ch вроде бы умеет только гибридное хранение с s3 свое, амазон не подключишь или селектел тот же)
а, ну да, self хостед ch, не облако, забыл упомянуть)
Обсуждают сегодня