хадуп с отдельными керберосами, которые не знают друг о друге? Интересует глобально, но в данный момент стоит задача перекинуть несколько ТБ данных с одного на другой. Есть hadoop distcp, но возникают сложности, начиная от кербероса, и продолжая конфигурациями кластеров(core-site.xml и т.д., конфигурации сравнительно навороченные). В идеале хотелось бы просто с клиентской машины с минималистичным хадуп клиентом сказать hadoop distcp... и чтобы данные полились.
Из дополнительных сложностей: default_domain один на оба кластера. Но это в будущем уйдёт.
Думаю что с таким вопросом лучше сюда: https://t.me/HadoopAdminsRU
Спасибо! Но вдруг кто и тут поможет
Обсуждают сегодня