запись, нужно очистить от дубликатов, какие варианты предложите? )
тестовое задание?
А шо по ресурсам?) Так то режешь и на кластере изи мап редюс Ну или спарк
Я бы сделал чтение порциями, запуск в не сколько потоков для обработки и складывать в разные файлы, если возможно, для большей пропускной способности. Ну или отсылать отформатированные данные в буфер для записи
кстати вот в этом варианте я столкнулся с проблемой синхронизации кусков
Велик шанс проебаться Ну по крайней мере я уверен что проебался бы) А так, офсет хранить не надо, есть классы с рандом доступом, то есть на них уже сделан какой то класс
Нужно исследовать. Но я чёт не хочу такие задачки за других делать)
Автору оригинального вопроса явно нужен merge sort. Только возможно не из 2х а более источников. А вообще задачка довольно простая, раньше в яндексе в кач тестового задания использовалась, за час полтора реально раскурить если уже был знаком с этими базовыми концепциями. Если не знаком то конечно гораздо сложнее...
Обсуждают сегодня