Кстати про паркеты. Можете подсказать, пожалуйста, как можно большую таблицу постгреса

выгрузить в паркет, желательно разделить, чтобы было несколько небольших паркетов вместо одного большого? Сейчас делается тупо селект всего в датафрейм пандас и потом по частям записывается, но таблица разрослась, и текущая реализация падает, когда оператива выжирается. Накинуть оперативы возможности нет...

8 ответов

9 просмотров

можно курсором воспользоваться

Можно спарком. Спарк и чанками умеет грузить. Вместо пандаса засунуть pyspark с master = local[1] тогда будет 1 чанк за раз грузить

Я просто спросил мб есть какие бест практис кто как делает. Что выгоднее и удобнее в конечном счете

Vadimio
Я просто спросил мб есть какие бест практис кто ка...

ну чисто логически спарком не очень удобно потому что кластер нужно поднимать еще и лить нужно в небольшое количество потоков. Это все делает клик

Vitaly Pismarev
ну чисто логически спарком не очень удобно потому ...

Клик неплохо справляется. В несколько потоков (s3Cluster -функция)

Можешь еще взять полумертвый sqoop. Но он без ходупа не работает вроде

Похожие вопросы

Обсуждают сегодня

Привет, сталкивался кто с такой ситуацией? У меня есть модальное окно Bootstrap, в нем кнопка закрытия: <button type="button" class="btn-close" data-bs-dismiss="modal" aria-...
Виталий
3
А если изначально бот работал так : есть сайт онлайн школы. У каждого ученика свой кабинет. Где он авторизуется по своим данным. И уже в кабинете, на самом сайте делает оплату...
Денис 💡 Фрилансер
13
что это и почему оно? executor.start_polling(bot, skip_updates=True, on_startup=on_startup, File "/usr/local/lib/python3.10/dist-packages/aiogram/utils/executor.py", line 4...
𐌍𐌄 ᕓ𐌄𐌓𐌌Ꝋ𐌓𐌄
2
Напомните пожалуйста, v1.1 работает на PHP 8.2?
Ross
7
А что насчет FluentValidation? тоже ведь есть альтернатива у МС.
devman
13
Ребят, всем привет) Кто юзал/юзает Postgres? Я на MySQL сделал простенький сайт для диплома, но я внезапно обнаружил условие что надо было на Postgres) Проблема в том, что я н...
Dororo Steeeve
4
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Спасибо. Начну с клиент-сервер. Там разберусь И еще вопрос - можно ли как то джобы отправлять на определенные клиенты? Например есть vdi и linux машина. Можно ли задачу оправ...
Sergey Ivanov
4
Всем привет! подскажите, кто-то использовал vault + гео-распределенный etcd-кластер (мемберы в разных цодах)? какие есть подводные камни? и стоит ли вообще такое делать?
Василиса Васильева
4
Тут кто-то шарит в мед оборудовании?
Benz
10
Карта сайта