одно s3 облако
данные с двух сервером перегнали на облако на один bucket и разделами 1 и 2 для каждого сервера
как получить данные второго сервера (bucket/2) из облака на первом сервере? без использования csv файлов в облаке и табличной функции s3
может что-то в файлах конфигурации нужно сделать или это нет способа кроме как держать csv файлы в облаке?
Примечание:
подключение к s3 идёт через файл конфигурации config.d/storage_configuration.xml
вопрос странный. Типа у меня был один шард, затем мы сделали 2 шарда, как от двух шардов добится поведения как будто это один шард. Зачем вы сделали два шарда? В чем был замысел?
на s3 в облаке будут исторические данные и логи. вот было два сервера с разными данными - потом пролили всё на облако (bucket/1 и bucket/2) и теперь из облака уже хотим получить все данные через клик из bucket/1 и bucket/2 - такое можно сделать?
ну так у вас 2 шарда, ну сделайте distributed таблицу
два сервера не связаны, а нужно разобраться с облаком)
не связаны в смысле сети вообще между ними нет, или что?
ну да, zookeeper нет - два не зависимых сервера с историческими данными - загрузили на облако и теперь нужно оттуда получить =)
это все не имеет значения для КХ. просто сделайте distributed таблицу или remote таблицу
можно сделать distributed с ссылкой на облако?
нет. можно сделать так что второй сервер будет запрашивать данные у первого, а первый будет ходить в s3 то что вы хотите, сделать нельзя. Для этого нужны данные которые хранятся на локальном диске и В ПАМЯТИ первого сервера
понятно спасибо ха помощь тогда есть другая тема можно ли как-то изменить название файлов на s3 ? например чтобы было название партиции? вставка не через табличную функцию s3
благодарю - можно ли где-то подробнее узнать об этом дизайне интересно почитать?
В исходниках кх. И в описании AWS как S3 шардирует обьекты
И вы пока не понимаете что на самом деле нельзя без метаинформации прочитать файлы, даже если у вас есть нормальные имена файлов.
ну вот и буду разбираться)
Обсуждают сегодня