Ads и Google Analytics на мой DWH на Redshift.
В гугле и от самого Airflow видел примеры передачи с GA на GCP или BigQuery.
А chatGPT дал решение чтобы на BiqQuery или GCP сначала а потом оттуда на Redshift (один из вариантов ещё включал S3 между GCP и Redshift).
Хотел спросить, может ли кто-то посоветовать что-то для задачи передачи данных с GA на Redshift?
Это задача интеграции данных, эйрфлоу здесь скорее для координации и визуализации.
1. GA -> S3. Надо смотреть какие есть способы выгрузки, вероятнее всего тянуть из API 2. S3 -> Redshift - вариантов много. Рабочий и довольно простой способ это использовать external table w/ Spectrum - https://docs.aws.amazon.com/redshift/latest/dg/c-spectrum-external-tables.html.
Обсуждают сегодня