спарком надо прочитать какой-нибудь день с условной fs? Партиции на fs посуточные, формируются по таймстемпу который в utc
Spark.read.parquet("/path/to/data/update_dt=yyyy-MM-hh")
Да, это у всех так. А если хочется прогнать спарк джобу по данным с привязкой к конкретной tz?
можете больше контекста дать?
а у тебя тз будет проблема что нужно партиции n-1 или n+1 еще читать
например, летят данные с мск временем, время переводят в utc и по .../yyyy-MM-dd/hh раскладывают на fs, а потом хочется прочитать за какой-то конкретный день по мск
но день по мск это две партиции в утс
Обсуждают сегодня