запросов к базе?
Каждый запрос обращается к отдельной дневной партиции
И записывает результат в список, в итоге получаю список датафреймов который потом обьединяю в один
Смысл задачи в том, что ресурсов мало, и запрос к базе в 365 гб почти не отрабатывает
Решил делать аггрегацию каждой партиции дневной и потом объединять вместе
В однопотоке выходит около 20-30 минут пока функция обратится к 365 патрициям и сделает аггрегацию каждой из них
Лучше всего использовать SQL
Вы не поняли вопрос Я и так SQL использую) Через функцию в Р я запускаю последовательно 365 таких запросов, под отдельные дневные партиции в базе
Так вы запускайте один запрос SQL, который подготовит для вас итоговый датафрейм.
Я уже написал что не могу так сделать
А, то есть у вас SQL сервер слабенький...
А почему вы считаете, что база которая не в состоянии агрегировать данные по 365 дней будет агрегировать те же 365 дней, но в параллельных запросах? Может быть у вас там индексы как-то криво настроены или ещё что?
Обсуждают сегодня