вам мультиклауд?
У нас часть компании в разных облаках.
возможно. но для финальных клиентов можно ведь в одно облако сгружать? query engine все равно будет работать на машинах одного облака, скоре всего. лучше один раз сгрузить, чем query engine из aws по каждому sql запросу будет через облака ходить за датой..
Там проще если данные будут у нас, потому что всякие там комплайнс требования для отгрузки данных третьим лицам это гемор. Дополнение: А наши данные находятся только в AWS, в то время как потребители в aws/gcp/Azure.
тогда средства доступа лучше разворачивать там, где дата лежит. если дата на ажуре и таскать ее нельзя - доступ через машины там же. далее - хотите ли вы унифицированный query engine, или вам ок чтоб часть стека вокруг бигквери, часть - воркуг aws редшифт - вам виднее уже 🤷♂
наши данные - это что? их клиентам надо предоставлять? полагаю, придется потребителям реплицировать
Клиенты хотят анализировать данные в нашем даталейке и получать инсайты.
Обсуждают сегодня