173 похожих чатов

На каком языке программирования лучше решать такую задачу?: Нужно сравнить два

txt файла на наличие похожих строк и удалить их из одного из файлов, при этом удаляя также и строки где совпадают словосочетания при перестановке слов местами, например,
в первом файле слово1 слово2 слово 3
удаляем во втором строки
слово1 слово2 слово 3
слово1 слово 3 слово2
слово 3 слово2 слово1

Далее, нужно чтобы было возможность исключать не учитывать некоторые символы при этом, их подгружаем в txt файл, например, чтобы можно было добавить туда спецсимволы, предлоги.

Ну и самое главное и сложное то, что первый файл весит 12GB и строк в нем около 200млн, второй файл гораздо меньше 200–250мб.
Из второго удаляются строки, которые есть в первом.

10 ответов

21 просмотр

По финалу выйдет прога на 3 гигабайта весом и будет требовать минимум 64г озу

На любом по сути

на каком умеете. согласитесь гораздо быстрее воспользоваться тем инструментом который знаете, чем изучать новый инструмент

1Bot- Автор вопроса

знаю несколько: бейсик, асм, паскаль, пхп, си, си++, питон, баш

1Bot
знаю несколько: бейсик, асм, паскаль, пхп, си, си+...

если заранее знаете что искать то баша достаточно, если заранее не знаете то пользуйтесь тем что умеете, на чём быстрее сделаете, если вопрос скорости не на первом месте

На том, который знаешь

Alexandr Petnitsky
На том, который знаешь

он же перечислил список

Serg Dove
он же перечислил список

Да там список такой, что легкое только из относительно выбирать

Олегсей Олешкович Бреднев
По финалу выйдет прога на 3 гигабайта весом и буде...

На ассемблере подобная программа уложится в пару десятков килобайт, но парсить строки там будет сдожно

На sql

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
есть ПО, которое лежит папкой, по сути и не инсталится, а просто запускается. Надо раскидать по машинам в домене. Я так понял, что прям настройками GPO, копировать я смогу тол...
Dmitriy
8
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
Карта сайта