На каком языке программирования лучше решать такую задачу?: Нужно сравнить два

Question

На каком языке программирования лучше решать такую задачу?: Нужно сравнить два

txt файла на наличие похожих строк и удалить их из одного из файлов, при этом удаляя также и строки где совпадают словосочетания при перестановке слов местами, например,
в первом файле слово1 слово2 слово 3
удаляем во втором строки
слово1 слово2 слово 3
слово1 слово 3 слово2
слово 3 слово2 слово1

Далее, нужно чтобы было возможность исключать не учитывать некоторые символы при этом, их подгружаем в txt файл, например, чтобы можно было добавить туда спецсимволы, предлоги.

Ну и самое главное и сложное то, что первый файл весит 12GB и строк в нем около 200млн, второй файл гораздо меньше 200–250мб.
Из второго удаляются строки, которые есть в первом.

#devops #programming #russian #system-administration

0

31.10.2023

10 ответов

42 просмотра

fl

На любом по сути

0

31.10.2023

Alexander Y.

на каком умеете. согласитесь гораздо быстрее воспользоваться тем инструментом который знаете, чем изучать новый инструмент

0

31.10.2023

1Bot Автор вопроса

знаю несколько: бейсик, асм, паскаль, пхп, си, си++, питон, баш

0

31.10.2023

Alexander Y.

1Bot
знаю несколько: бейсик, асм, паскаль, пхп, си, си+...

если заранее знаете что искать то баша достаточно, если заранее не знаете то пользуйтесь тем что умеете, на чём быстрее сделаете, если вопрос скорости не на первом месте

0

31.10.2023

Alexandr Petnitsky

На том, который знаешь

0

31.10.2023

Serg Dove

Alexandr Petnitsky
На том, который знаешь

он же перечислил список

0

31.10.2023

fl