169 похожих чатов

Подскажите, как работать с большими текстовыми файлами? Допустим 10 гигов, на

миллиард строк

Могу ли я прочитать конкретный кусок файла, указав номера строк, или ещё как-то? Допустим кусок 10-15%

Как осуществлять поиск по файлу?

Как можно в принципе объединить два файла по 10 гигов в один?

14 ответов

22 просмотра

Можешь. Но если строки произвольной длинны - то без учёта строк. Читать можно в провольной позиции произвольную длинну. В байтах, не в строках

Раз спрашиваете видимо не можете. 10 ГБ по современным меркам это маленький файл. Его проще загрузить в ОЗУ и работать прям там только не забудьте в ограничениях к проге указать 32 ГБ ОЗУ Что касается решения для старых компов. То используем Delphi XE 10. FPC не подходит он с файлами больше 2 ГБ плохо работает. Разве что для него на winapi писать. А на Delphi можно использовать TByteStream и TFileStream. Перемещение можно сделать через seek на нужное число байт. Все остальное в ваших руках.

Ты лучше скажи, что для чего это тебе надо?

Missclick Очепятка
Раз спрашиваете видимо не можете. 10 ГБ по соврем...

Интересно, сколько времени займет загрузка 10Г-файла в память? :)

Кириллл-🚀 Go Aaply Автор вопроса
Alexey Shumkin
Ты лучше скажи, что для чего это тебе надо?

Есть файлы с пользовательской информацией, весом, который может превышать объем оперативки. Хочу почистить дубли строк, объединить файлы в один, и организовать поиск по нему

Кириллл 🚀 Go Aaply
Есть файлы с пользовательской информацией, весом, ...

Что такое "пользовательская информация"? Какой формат этой информации? В каком она виде? Почему там есть дубли? Зачем их удалять? И зачем по нему искать?

Кириллл-🚀 Go Aaply Автор вопроса
Alexey Shumkin
Что такое "пользовательская информация"? Какой фор...

На что повлияет мой ответ на эти вопросы?

если речь о Win, то стоит посмотреть в сторону MMF

Viktor Akselrod 💻
если речь о Win, то стоит посмотреть в сторону MMF

Linux, к слову, с MMF тоже вполне справляется :) Linux does this via the mmap system call.

Handatros
Linux, к слову, с MMF тоже вполне справляется :) ...

не исключено. я могу говорить только за то, что знаю 🙂

Кириллл-🚀 Go Aaply Автор вопроса

Всё — это данные, о которых я выше говорил Хранить — потому что они мне нужны Хранить на компьютере под виндой на ссд, локально Данные должны ХРАНИТЬСЯ в файле формата тхт, это их цель, их путь, их предназначение, при редкой необходимости нужно делать поиск по этим данным. Первоочередная цель у меня была — научиться работать с файлами, размер которых может быть десятки гигов, плюс привести в порядок имеющиеся данные

Кириллл 🚀 Go Aaply
Всё — это данные, о которых я выше говорил Хранить...

Хранить много гигабайт данных в виде простого текстового файла не стоит. ну если конечно волнует скорость работы с ними

У меня вчера в команде аналитики тоже четко знали, что им нужно: что нужно доработать фронт и бэк, чтобы они могли в SQL запросах использовать переменное количество условий... В ходе обсуждения оказалось, что они не знали, что в запросах можно использовать "вот такое-то" условие, чтобы оно "выключалось"... Час обсуждения и выяснения, что же именно им надо, сэкономило часы доработок трёх человек

Alexey Shumkin
У меня вчера в команде аналитики тоже четко знали,...

аналитики видимо не опытные, теперь знают. так и программировать научатся.

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта