(но как я понял, основное это циклы)
Основное, то что Р векторизован из коробки
векторизация, data.table, пайпы
Я питоном пользовался и долго, с 2005-го, но не для DS. А подгорел он мне в этом году по одной простой причине. Карантин, отсутствие физического наблюдения и тотальная удаленка привели к потере 4-х человек. Причём по совершенно иррациональному принципу. На хх требуется питон, что я буду делать через N лет? Все хорошо сейчас, но надо на питон уйти. Есть такая профессия. Грузчик. Больших данных. Поэтому я его обратно поднял и погонял. От его болевых точек в DS тошнит. Ничего не изменилось с 2012.
Илья, я вот питон совсем не знаю, это правда, что там только через циклы и по-другому никак?
Можно пандасом, там вектора. Но он архитектурно безумно кривой, в прод с ним нельзя. Нам же не Юпитер на ноуте гонять, а 24x7 запускать. Писал на хабре. Проблема — BlockManager
Ещё list comprehension
Я вот в такой шизофрении, Юра, живу. Открываю, когда Питон на работе и говорю себе - теперь мысли циклами, циклами, циклами 😂😂 Но на самом деле потом забиваю, беру неоптимальный Пандас и делаю всё на нём
Можно в вектора пихать что-то через силу. Скачать какую-то векторную библиотеку, в нее залить функцию в правильном формате и юзать. Много танцев с бубном. Ну и преобразование данных в столбцах - цикл в цикле в цикле :) Ради 10 дешевых итераций на маленьком датасете разбираться с переводом в векторность не очень класс, но и смотреть на код с циклами тоже не приятно(
сочувствую, думал ты R юзаешь на работе...
Для исследований да, а прод автоматизации весь на Питоне, тут просто выбора нет
Ну смотря где Щас гоу активно вкатывается, и не только из за моды, а из за своих характеристик
Илья, благодарю, за развёрнутые ответы. Ещё обратил внимание (при демонстрации синего экрана с кодом) - на количество комментариев к каждой строке кода - буду знать как выглядят построчные комментарии)
Обсуждают сегодня