173 похожих чатов

На каком языке программирования лучше решать такую задачу?: Нужно сравнить два

txt файла на наличие похожих строк и удалить их из одного из файлов, при этом удаляя также и строки где совпадают словосочетания при перестановке слов местами, например,
в первом файле слово1 слово2 слово 3
удаляем во втором строки
слово1 слово2 слово 3
слово1 слово 3 слово2
слово 3 слово2 слово1

Далее, нужно чтобы было возможность исключать не учитывать некоторые символы при этом, их подгружаем в txt файл, например, чтобы можно было добавить туда спецсимволы, предлоги.

Ну и самое главное и сложное то, что первый файл весит 12GB и строк в нем около 200млн, второй файл гораздо меньше 200–250мб.
Из второго удаляются строки, которые есть в первом.

10 ответов

2 просмотра

По финалу выйдет прога на 3 гигабайта весом и будет требовать минимум 64г озу

На любом по сути

на каком умеете. согласитесь гораздо быстрее воспользоваться тем инструментом который знаете, чем изучать новый инструмент

1Bot- Автор вопроса

знаю несколько: бейсик, асм, паскаль, пхп, си, си++, питон, баш

1Bot
знаю несколько: бейсик, асм, паскаль, пхп, си, си+...

если заранее знаете что искать то баша достаточно, если заранее не знаете то пользуйтесь тем что умеете, на чём быстрее сделаете, если вопрос скорости не на первом месте

На том, который знаешь

Alexandr Petnitsky
На том, который знаешь

он же перечислил список

Serg Dove
он же перечислил список

Да там список такой, что легкое только из относительно выбирать

Олегсей Олешкович Бреднев
По финалу выйдет прога на 3 гигабайта весом и буде...

На ассемблере подобная программа уложится в пару десятков килобайт, но парсить строки там будет сдожно

На sql

Похожие вопросы

Обсуждают сегодня

читать файл максимально быстро? странный вопрос))
zamtmn
53
Привет. Сразу скажу, что на C/C++/Rust я не пишу, но тем не менее возникла потребность дебага C/C++/Rust кода. Суть: есть серверное приложение, которое периодически ведёт себ...
ninekeem 🐳
4
А чего сейчас в моде вместо Error для эксепшенов? А то я тут внезапно узрел что он не рекомендуется :) У Try::Tiny какой-то совершенно ужасный синтаксис если надо конкретные э...
Denis F
17
или вы считаете муит дает знание?
супер_лох_3000 альфа версия
12
А кто такой мужчина в твоем понимании Азиз?
who?です 🐈
11
Ну значит тебе повезло, мы же про транк говорим оба?
Александр (Rouse_) Багель
11
всем привет! углубившись в плюсы и начав изучать реверсинг понял, что без асм'а никуда со своими высокоабстрактными представлениями начал изучать механизмы асма, и не совсем п...
9
а зачем этот вопрос для удаления из чата?
Mёdkinson Medvezhkin
63
Всем ку. Подскажите, если задекларировал массив так: int arr[10] = {1, 2, 3, 4}, то в arr[4] будет мусор или нуль?
Sasha K
14
буквально один оставшийся вопрос при выполнении строчки mov eax, 5 операнд "5" будет присутствовать где-либо в памяти (любой), кроме как в памяти блока .code? подвопрос: как...
12
Карта сайта