которых после FROM пишется имя пандас-датафрейма. Примерно так:
from pandasql import sqldf
q = 'Select distinct source_file, model, serial_number, dt from df'
df1 = sqldf(q, locals())
Она очень здорово снимает мою боль - я хорошо пишу SQL, плохо пандас, и при этом не имею возможности воткнуть SQL на этапе обращения к БД, и вынужден давится пандасом.
Собственно вопрос. Олл, известны ли вам аналоги pandasql? Она заброшена в 2016 году, и подмножество SQL в ней реализовано довольно узкое.
лучше выучи пандас, больше пользы
Нет. Больше двух лет с ним вожусь - тошнить не перестало
может быть вообще лучше его не трогать? я так решил свою проблему нелюбви к нему
Это было бы идеально, но работа. Мне на вход приходит датафрейм.
тогда увы. Я тоже егоне люблю, но если вдруг нужно юзать его, имеет смысл юзать его, а не делать странные обертки. На крайний случай - сконвертировать в обычный питоновский список словарей
Pandasql меня почти полностью устраивает. Ну странная обертка, но в конечном счете разницы нет как манипулировать табличками. Прикол в том что мейнтейнер pandasql, закрывая проект написал что то вроде - фак ю, отвалите со своими пулл-реквестами, аналогов и так дофига, а это моя библиотека.
И вот я ищу эти аналоги
Есть разница. То ли ты пишешь код, который никто кроме тебя не понимает на неподдерживаемых технологиях, то ли привычный большинству код
Хм, писать SQL-запросы к табличкам лежащим в БД - норм, а те же запросы к csv-файлам (зачитаным в пандас) - моветон. Ну, ок бумер, это твой чат
во-первых, не те же, во-вторых, для реляционных БД это основной механизм в-третьих, никто не пишет, зачем выделяться кроме как для экспериментов в-четвертых, структура данных даже отличается
Обсуждают сегодня