в народном хозяйстве? Для чего он юзается? Написать свой спарк?
ну дсы когда ту пандас делают, если использовать arrow, то сильно лучше и pandas_udf, да
Dremio вот использует. И на смартдате я спрашивал докладчика оттуда, что и как можно сделать с данными, но реляционки не умеют отдавать в Arrow Flight, поэтому пока я не вижу, как бы применить с пользой(
to_pandas это что-то на пуспарковом?
да) конвертация из spark dataframe в pandas dataframe
Я оттуда же и стал интересоваться.
в контексте паркета как мемори маппед файл можно использовать его а некоторых случаях что круто мож конечно не так круто как хотелось бы но вот оно так
Так получается, в пайплайне можно сканить и транформить сколько угодно паркетов с ограниченным выделением памяти? И почти zero copy на сер-десер?
Обсуждают сегодня