раз не попадал на пандасовский мультииндекс, все время головная боль и ощущение жуткого обмана.
Может я не нахожу секретный ингредиент? Или зеленые очки нужны?
Вместо понятных N колонок по которым можно делать произвольную фильтрацию, сортировку и группировку притягиваются эти мультииндексы, которые надо хитро слайсить и не забывать постоянно сортировать.
У растаманов спрашивать бесполезно — измененное сознание.
Илья, головную боль поддерживаю
но может я что-то не раскурил?
Возможно это просто иная парадигма мышления. В том смысле что для разрабочика - наличие понятной и контролируемой структуры, директивно и прозрачно заданной, намного лучше и безопаснее чем привязка к свойствам некоторых объектов. Например факторы - это явно хорошо с точки зрения аналитики, но кошмар с точки зрения разработки. Их поведение полно нюансов, они могут на ровном месте начать принимать NA значения при работе с их уровнями и тд.
А именно разработчики пользуются pandas? Мне запретили в прод тащить)
factor = enum, вполне себе ясная аналогия
так и enum плохо с точки зрения разработки
и разработчики в т.ч. Запрет на GPL вынуждает...
именно разработчики его писали) Ну это просто предположение, я свечку не держал. Но я довольно много смотрю питонячьего не аналитического кода и вижу прям эти паттерны
да, но тут нет двойного дна. знаешь — используешь. не знаешь — работаешь со значениями
Это логика аналитика, а не разработчика)
не так... если ты берешь фактор — должен знать что это за зверь и почему ты его взял. в обычной жизни можно без него обходиться.
ну так и получается. Что у тебя есть векторы,контейнеры для векторов, фактор, группировки (которые то снимаются, то не снимаются, а когда не снимаются надо специальный аргумент давать, а если не дать то выхватишь сообщение в консоль с которым надо что то делать) , иногда оконные функции будут работать без принудительной сортировки, иногда нет. До хрена нюансов. С точки зрения разработчика - это все мутный зоопарк. Да и ок, ты знаешь, тот кто читает код после тебя - может и не знать. Ты и сам сегодня знал, а завтра забыл) Поэтому удобство кода приносится в жертву прозрачности и интерпретируемости. А завтра еще изменят в языке пакет, и ты опять перестаешь понимать, будет сообщение о групировке или нет и тд.
есть немного... поэтому в счетном проде лучше всего прозрачный stateless data.table
Ну вот от этой логики разработчик и говорит и идет. Давайте я буду прозрачно управлять структурой индексов. Будет понятно и однозначно всем, и не будет требовать справочной информации. Автотесты проще написать. и тд. Короче это реально другая парадигма, ну на мой взгляд. Другой вопрос, что сотни строк кода аналитического писать не требуют такого подхода и намного удобнее со всем синтаксическим сахаром и трюками с объектами
если бы так... возвращаясь к исходному вопросу. ни разу ведь не проще. кроме базовых принципов надо еще и чеклист на каждую строку проверять. что там разработчики напридумывали и будет ли оно работать так как должно https://pandas.pydata.org/pandas-docs/stable/user_guide/advanced.html
А это уже реализация) Не единственный вопрос к пандасу и петону.
Обсуждают сегодня