215 похожих чатов

Вчера говорили про ETL и Data Engineering и вот сегодня на

очередном курсе (от SkillFactory) я там в беседе с ментором сказал не могу понять как имплементировать знания в практику — мою практику. И она сказала, что мне нужно посмотреть как настраивать архитектуру СУБД, Data Engineering

Можете посоветовать, пожалуйста?

Конкретно моя проблема: у меня есть табличные данные в csv объемом ~1ГБ о грузоперевозках по железной дороге. Данные структурированы. Но не могу их обработать потому, что Excel не тянет вообще (датасет поделен на файлы по 50 МБ).

Может кто дать практический совет, пожалуйста?

На данный момент есть навыки Python, SQL (отправлять запросы и тд, синтаксис)

8 ответов

16 просмотров

а в чём проблема при помощи pandas обработать? тут даже субд для такого не нужна

Edward Azizov
а в чём проблема при помощи pandas обработать? тут...

В том, что пандас не стоит много денег, а другое стоит

Husan- Автор вопроса
Edward Azizov
а в чём проблема при помощи pandas обработать? тут...

до pandas еще не дошел... в алгоритмах и ООП пока углубляюсь))) надо глянуть

Husan
до pandas еще не дошел... в алгоритмах и ООП пока ...

просто у вас вопрос был о том, как на практике применить обработку данных вот и советую пандас конечно, можете написать (со знанием алгоритмов и ооп) свой функционал, если есть желание. читать csv, задавать типы, обрабатывать там

Husan- Автор вопроса
Edward Azizov
просто у вас вопрос был о том, как на практике при...

писать свое нет ни времени, ни желания)) запрос простой — делать сортировку, фильтр и тд SQL отлично с этим справляется, но как настроить у себя на компе не могу понять

Husan
писать свое нет ни времени, ни желания)) запрос пр...

загуглите pandas если уже есть опыт в питоне, знакомство с ним будет на изи и почти 90% ваших запросов на обработку табличных данных можно будет сделать им

Husan
писать свое нет ни времени, ни желания)) запрос пр...

плюс его более "низкоуровневый аналог" numpy

Husan- Автор вопроса

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Ты просто гитлеровскую эстетику плохо понимаешь. Он же всё под Цезаря делал. А это как бы запрещённый приём в политике. Пиджаки они зачем все носят? Чтобы показать что они тип...
Ivan Kropotkin
4
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
а чем лучше всего сделать глобальный лок, если много нодов, до сотни? ну то есть мне надо, чтобы некоторые операции с объектом не происходили одновременно. перемещение между н...
Д. П.
15
Hi guys, I'm looking for a good LLM course. Is there any course to learn LLMs in advanced? I'm aiming to use them in my apps, so a perfect course in my openion, is not only a ...
Taha
14
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
Легче писать на C++ чем на C, если полностью не изучать C++, а знать только основное?
Алмаз
8
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
Карта сайта