Кстати раз зашла речь про персист df2 = df.persis() df2.isEmpty() - считает

один раз и не вызывает реально кеширование датафрейма

df2.count() - вот тут уже посчитает весь датафрейм и заперсистит его

я понимаю что isEmpty имеет упрощённый план до первой непустой партиции
но на persist датафрейме я бы ожидал что оно тригернёт вычисление и кеширование указанного дф чтобы потом след операцией я уже работал с кешированным

а так получается первый раз isEmpty молотит
потом второй раз молотит когда я дествительно с фреймом работаю

может кто-то объяснить логику или я хочу слишком много?

1 ответов

24 просмотра

Пока что получается вот такой оператор (без обёрток): df.limit(1).groupBy().count().queryExecution.executedPlan.executeCollect().head.getLong(0) executeCollect() уже возвращает локальную коллекцию, так что дальше можно не смотреть. Но походу, всё дело в limit(1), который создаёт GlobalLimit, которому нужно распределение с числом партиций 1, а это coalesce, который будет добавлен в какой-то стратегии. Дальше мысль не идёт, как связать с моментом кеширования не вижу. Ещё посмотрю ближе к ночи

Похожие вопросы

Обсуждают сегодня

Ребята, всем привет. Подскажите, пожалуйста, можно ли как-то через бота понять, что этого бота добавили в группу\канал и выдали ему права администратора?
Artem Stormageddon
9
Это переведённый текст с английского. Я не говорю на русском, но могу использовать переводчик Телеграм. Приветствую! Я начинающий веб-разработчик и все еще учусь. В настояще...
𐩱𐩪𐩣𐩱𐩲𐩺𐩡
3
А не хотим ли мы развлечься? 😉 Но так чтобы с пользой для наших профессиональных навыков?? 👨‍🎓👩‍🎓 Предлагаю на октябрь запланировать тестовый запуск новой командной игры "Игр...
Andrii Kurdiumov
2
Привет всем! Почему этот код не срабатывает при добавлении или удалении пользователя из чата? bot.on('chat_member', async (ctx) => { console.log(ctx); }) bot.launch({allo...
Alexander
5
у кого сколько оперативы на базе данных ?
АДИЛЬБЕК
4
Через бот апи возможно получить ID стикерпака? Не ссылку.
Vexylon [АФК до 09.09]
5
Привет Хочу сделать аналог iCloud’а для своих проектов, чтобы пользовательская информация хранилась в облаке, была доступна во всех сервисах, её можно было подсасывать везде)...
Виталий
9
В тг можно спарсить всех кто пишет в группе? Если список участников скрыт
S
3
код Event::listen('cms.page.display', function (&$content, $slug, $page, $html) { if (is_object($content)) { dump($content); } else { dump($s...
Point 111
3
Всем привет. Не понимаю, в чём тут шутка юмора. Убирается только разрешение на send_messages. А send_media_messages остаётся. Как сделать, чтобы оба убирались? await b...
Alexander
2
Карта сайта