Всем мастерам и ученикам салют. Подскажите кто сравнивал и вообще

Question

Всем мастерам и ученикам салют. Подскажите кто сравнивал и вообще

оценивал потенциал R. Просто очень много времени потерял пытаясь все свои задачи тащить исключительно на PBI, а сейчас часть пилю на SQL сервере, часть в пандах, а остальное в PBI. И вот наткнулся на R. На данный момент мне очевидно, что универсального средства нет, так sql сервер делает вычисления на миллионы строк, pandas отлично "итерирует", а в PBI хорошо "сшивать/перешивать" модель данный. А как вы именно используете R, как он работает с датасетами с миллионами строк? То, что визуализация у него круче это бесспорно, а в остальном? Не хотелось бы опять методом проб и ошибок, хочу услышать мнение "бывалых".

#programming #r #russian

0

29.05.2022

10 ответов

16 просмотров

German Rikov Автор вопроса

Ilya Shutov
Зависит от задач. Обычно миллионы строк — чихнуть ...

Спасибо за отклик, интересно... Панды действительно лагают ( у меня на datetime и локации) но их скорость и "пакетный"(батчевый подход) хорошо решает многие задачи. Но ни панды ни PBI не могут сделать нарастающий итог с группировкой по 4 столбцам если количество строк больше 10 миллионов. Пришлось прибегнуть к mySQL. А у Вас какой придел вычислений в rstudio?

0

29.05.2022

Ilya Shutov

German Rikov
Спасибо за отклик, интересно... Панды действительн...

Легко. Пересаживайтесь не раздумывая. Бенчмарки Вам в аргументацию: https://h2oai.github.io/db-benchmark/

0

29.05.2022

German Rikov Автор вопроса

Ilya Shutov
Легко. Пересаживайтесь не раздумывая. Бенчмарки Ва...

мой датасет 70 лямов, как вы думаете потянет с группировкой с кумулятивным итогом?

0

29.05.2022

Ilya Shutov

German Rikov
мой датасет 70 лямов, как вы думаете потянет с гру...

Легко

0

29.05.2022

Vitalijs

German Rikov
мой датасет 70 лямов, как вы думаете потянет с гру...

У меня где то 228M

0

29.05.2022

Vitalijs

Vitalijs
У меня где то 228M

И группировка в data.table без проблем)

0

29.05.2022

German Rikov Автор вопроса

Vitalijs
И группировка в data.table без проблем)

Огогули а сколько оперативной на Вашей машине?

0

29.05.2022

Ilya Shutov

German Rikov
Огогули а сколько оперативной на Вашей машине?

От 16 до 128. Разные машинки

0

29.05.2022

Vitalijs

German Rikov
Огогули а сколько оперативной на Вашей машине?

Много

0

29.05.2022

Ilya Shutov · Accepted Answer

Ilya Shutov

Зависит от задач. Обычно миллионы строк — чихнуть не успеешь. А pbi во многих задачах может быть заменён shiny, причём куда успешнее. Панду вообще лучше не трогать — их косяки неоднократно обсуждались.

0

29.05.2022

169 похожих чатов

Всем мастерам и ученикам салют. Подскажите кто сравнивал и вообще

10 ответов

Похожие вопросы