169 похожих чатов

Читать файл максимально быстро? странный вопрос))

53 ответов

130 просмотров

An unhandled exception occurred at $000000010001D11F: ERangeError: Range check error $000000010001D11F PARSESTRING, line 347 of uzfilestream.pas $000000010000186D TESTMMF, line 48 of streamtest.lpr $00000001000023D1 main, line 89 of streamtest.lpr $0000000100002E96 $000000010000F950 $0000000100001770 $00000000777D59CD $000000007793383D

zamtmn- Автор вопроса
Alexey Kulakov
An unhandled exception occurred at $000000010001D1...

там арифметика и логика, контроль переполнения включать ненадо

поправка - читать огромный текстовый файл это сродни SQL-выборке миллиона записей и то, и другое, порождает законный вопрос - "зачем?"

zamtmn- Автор вопроса
Iluha Companets
поправка - читать огромный текстовый файл это срод...

есть много текстовых форматов обмена данными, не всё уперлось в бд

zamtmn
есть много текстовых форматов обмена данными, не в...

я пока что вижу, что задача надуманная

zamtmn- Автор вопроса
Iluha Companets
я пока что вижу, что задача надуманная

15 гигов естественно для стресстеста, но до гига вполне в моей работе текстовые файлы проскакивают

🥓 Хамон Эврибади
дампы баз, логи...

а зачем их читать целиком ??

Iluha Companets
а зачем их читать целиком ??

руки вырвать тому, кто пишет логи одним файлом на сотни мегов

Iluha Companets
а зачем их читать целиком ??

DXF - чертеж, пока не прочитаешь целиком - невозможно отобразить

🥓 Хамон Эврибади
чтобы распарсить

и? зачем парсить сразу такой огромный объём?

Iluha Companets
и? зачем парсить сразу такой огромный объём?

Окей. живой пример. лог керио за несколько лет (за определенную дату не умеет выгружать) на 8 гб. плюс собранные логи с компов, в сумме, где-то на 12 Гб. всё это распарсить, чтобы определить чем на самом деле занимался юзер в интернет и локальной сети.

Спасибо Абобе

🥓 Хамон Эврибади
Окей. живой пример. лог керио за несколько лет (за...

как тут правильно подметили, нормальный логгер разбивает логи, а не делает огромные куски

zamtmn- Автор вопроса
notme
Спасибо Абобе

автодеску. а за ifc емнип Graphisoft

zamtmn
автодеску. а за ifc емнип Graphisoft

ок, не моя тема... кстати, а пробовали использовать sed ?

Iluha Companets
ок, не моя тема... кстати, а пробовали использоват...

тут не проканает, парсинг нужен - чтобы перевести во внутреннее представление, десериализация короче

zamtmn- Автор вопроса
Iluha Companets
ок, не моя тема... кстати, а пробовали использоват...

он никаким боком тут. это просто текстовое представление бинарных данных. нужно всё распарсить. И даже если ты потом чтото выкинешь, это нужно распарсить чтоб понять что можно выкинуть. Никакого оглавления - читать отсих-досих нет. while not eof

zamtmn
он никаким боком тут. это просто текстовое предста...

ок, но с логами он может помочь (разбить по дате и т.п.)

Iluha Companets
и? зачем парсить сразу такой огромный объём?

ещё прелесть подкинуть? csv с более чем 1 млн строк

Кокошник наголо
Хуже DXF только postscript

зато формат достаточно универсален

🥓 Хамон Эврибади
ещё прелесть подкинуть? csv с более чем 1 млн стро...

нет предела извращенству... кто такие CSV пилит - тому тоже надо задать вопрос "зачем?" )))

Iluha Companets
нет предела извращенству... кто такие CSV пилит - ...

в открытых данных до сих пор выкладывают такие датасеты

Alexey Kulakov
зато какой простой формат!

формат-то простой, и хороший... но разбивать данные тоже надо

zamtmn- Автор вопроса
Alexey Kulakov
зато какой простой формат!

хуже воровства - это про такую простоту))

Iluha Companets
формат-то простой, и хороший... но разбивать данны...

так там поля разделяются. 1 CSV файл = 1 таблица

🥓 Хамон Эврибади
этот вопрос исчерпан?

про автокады и иже с ними я понял, остальное надуманно

Iluha Companets
про автокады и иже с ними я понял, остальное надум...

ковыряли выгрузку из 1с на несколько млн позиций?

zamtmn- Автор вопроса
Iluha Companets
про автокады и иже с ними я понял, остальное надум...

что бы ты не надумывал, файлы надо читать максимально быстро))

🥓 Хамон Эврибади
ковыряли выгрузку из 1с на несколько млн позиций?

я понимаю, щас можно накатать сколько угодно примеров, но где в них будет играть роль быстрого чтения файла? экономия нескольких секунд ради чего? чтобы быстрее начать "ковыряние", которое продлится несравнимо дольше?

zamtmn- Автор вопроса
Iluha Companets
я понимаю, щас можно накатать сколько угодно приме...

ради того чтобы работало побыстрее. глядишь и разроботчик той бд тоже почешет репу и инсерт ускорится))

Iluha Companets
я понимаю, щас можно накатать сколько угодно приме...

ну-да, какая разница сколько будет читаться файл, час или 5 минут. работнику и так зарплата капает, пофиг что его начальник на нервах из-за скорой сдачи отчёта

достаточно, чтобы не парицо

zamtmn- Автор вопроса

10+50

zamtmn- Автор вопроса

дело не в одном только ммфе. изначально в качестве правильного вариана мне было предложено straem.Read(Result,1) с предложениями не заморачиваться - это медленней в десятки раз

Iluha Companets
я пока что вижу, что задача надуманная

всяко бывает. хотя бы парсинг логов

Кокошник наголо
руки вырвать тому, кто пишет логи одним файлом на ...

ну вырвать не вырвать, но не такая уж редкость

Handatros
ну вырвать не вырвать, но не такая уж редкость

напомнило один случай с игрой, когда разрабы выпустили в мир дев-версию, у которой логи писались на каждый чих. пара часов игры и несколько десятков гигов в файлике лога 🤣

сама прелесть была в том, что лог писался только на системный раздел

Нну, PDF напрмер, тоже текстовый формат.

zamtmn
дело не в одном только ммфе. изначально в качестве...

Ну неправда же, сразу тебе говорил, что MMF. https://t.me/Delphi_Lazarus/318803

zamtmn- Автор вопроса

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
вы делали что-то подобное и как? может есть либы готовые? увидел картинку нокода, где всё линиями соединено и стало интересно попробовать то же в ddl на lua сделать. решил с ч...
Victor
8
Подскажите пожалуйста, как в CustomDrawCell(Sender: TcxCustomGridTableView; ACanvas: TcxCanvas; AViewInfo: TcxGridTableDataCellViewInfo; var ADone: Boolean); получить наз...
A Z
7
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
4
Он в одиночку это дело запилил или была какая-то команда?
Aquinary
12
~ 2m21s  nix shell github:nixos/nixpkgs#stack ~  stack ghc -- --version error: … while calling the 'derivationStrict' builtin at /builtin/derivation.nix:...
Rebuild your mind.
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Карта сайта