патриций знак равно на %3D, я читаю через протокол s3 этот партицированный датасет. Если поменять битый символ руками на равно и полностью прочитать паркет, то он читается. Вопрос, можно круто через arrow или спарк сказать, что маски к моим партициями задаются через $key%3D$value?
Чё у тебя за файловая система?
O3fs (ozone) отдельное решение
А, вы на бармитол заехали
А не проще циклом пробежаться и переименовать по нормальному?
Сед там авк все дела
Через s3 прям? Это O(data) вроде, дороговато . Но я пробовал, не поддерживается , во всяком случае через s3 протокол. Надо попробовать через 03fs
Я не знаю, какой там консольный клиент у него. Типа hdfs dfs -mv нету? O(число партиций), вряд ли их охулиард.
Да, я согласен, просто не подумал сразу, не через s3
У него какая-то велосипедная ФС внутренней разработки, я так понимаю. И ренэйм вызывает движение данных, как в aws s3. надеюсь что все-таки не
Почему велосипедная-то? Апач озон.
Впервые слышу 😔 И это не считается экзотикой?
Ну типа более лутший и новый хдфс с другой рахитектурой.
Мы патчили hadoop-aws jar для того, чтобы с ozone нормально работало, а вообще обещают пофиксить в след релизе озона, но когда он будет…)
Это проблема озона, отдает пути при листинге url encoded по дефолту
Ну умеем в жабу, придется ждать, или искать патченный джар) но за ответ спасибо, полезно
А много патчить? Может подучим)
В реестр российского ПО, все дела)
А можт озон запатчить?🤔
Обсуждают сегодня