выбираю загрузку всех строк query = """select * from table;""" - тогда очень долго обрабатывается и ноутбук виснет, если query = """select * from table LIMIT 1000;""" выбирает 1000 строк, Как мне можно прописать df = pd.read_sql(query, engine) чтобы работать со всеми строками?
ваш вопрос - как обработать 7195903 строк за время, которое обрабатываются 1000 строк?
Это происходит потому что вам не хватает памяти. 1 вариант - юзать чанки, процессить что нужно и потом сохранять в отдельный файл, 2 - юзать dusk или что-то подобное, работает быстрее , 3 - при загрузке выбросить ненужные колонки,а у нужных поменять на int/float, там по умолчанию тип колонки object а он ждет уйму памяти.
спасибо, буду делать.
Обсуждают сегодня