* from schema.table)").load()
Запуск производится посредством spark3-submit.
При запуске с использованием настройки --master yarn файлы, которые подгружаются через addFile, не видны для дальнейшего использования. Выкидывается ошибка FileNotFoundException, который ссылается на темповую область спарковского приложения. В свою очередь, при запуске с использованием --master local этот трюк проходит и такая ошибка не возникает.
В связи с этим и возникает вопрос - из-за чего может быть такая ошибка? Есть ли альтернативные пути, по которым можно считать файл бд с hdfs, или же есть только путь через расшаривание файла на все ноды используя addFile?
надо ему default файловую систему указать hdfs. либо, если заработает, указать ucanaccess://hdfs:// 🤷♂ скорее всего не взлетит, тогда 1 вариант
Обсуждают сегодня