(почти также как и в индексации данных Hive over HDFS). Как можно зафиксировать датафрейм на всё время выполнения, чтобы иметь дело с immutable data snapshot? П.с. Данных дохера, всё в кэш не влезет.
Partition swap
Обсуждают сегодня