меня есть два датасета, один из которых на 10гб. В датасетах есть общее поле Id, мне нужно соединить два датасета по общему полю. Как я делал, открывал один файл и искал один и тот же id в другом, потом записывал в новый. Но у меня сложность O(n*m), можете подсказать как можно это ускорить дело?
как так. исходный формат какой? почему бы dict c ключами ввиде id не использовать?
Обсуждают сегодня