в 100-1000 раз меньше обьема обрабатываемых данных на сервере (10Тб)?
Любой, вопрос в том, сколько это займёт времени; если задача не требует всех 10 тб , то можешь делать выборку в хранилище и работать с этой выборкой; или можно по одному из коннектов R/python выполнять все непосредственно там, где лежат данные, этот вариант быстрее, но сложнее в реализации, первый проще, но время на перекачку данных может огорчать
Обсуждают сегодня