формате zip по партициям. Например. FactSales_20160501.zip, FactSales_20160601.zip и тд. Для External слоя хранилища я планирую создать External таблицы на файлах. Собственно вопрос как это можно реализовать ? Знаю что redshift умеет собирать файлы партиций в 1 единое. Внутри архивов находится по файлу формата .csv
Можно
Не подскажите в какую сторону копать или ссылки на статьи ?
зачем вообще нужен external слой? сору и готово
Таковы требования. Это учебный, финальный проект
можете весь список требований дать? а то пока что кажется, что ваша задача решается десятками способов разной паршивости 🤷♂
Есть s3 с данными и redshift. Постройте ДВХ с 4 слоями. External layer, landing layer, 3nf layer и DM layer. На базе этой ДВХ по требованям построить отчёт в power bi с основными метриками.
Red shift не может в зипованный csv?
Зип кажись нет. Gzip и другие форматы может
gzip, lzop, or bzip2 ток
Ну ты попробуй
Обсуждают сегодня