Знатоки Databricks, прошу помощи. У нас есть контейнер с картинками в

Azure Datalake Gen2. Причем часть картинок лежат в самом контейнере, а часть - во вложенных папках, типа

container_name/kek.jpg

container _name/2023/06/25/lol.jpg

В датабриксе включен Unity Catalog.
Я пытаюсь создать Databricks Volume к контейнеру с картинками. В итоге volume видит файлы, которые лежат в самом контейнере, но не видит подпапки и файлы, которые в них лежат.

Я вроде как понимаю, что для картинок не работает hierarchical storage, и все файлы там хранятся как flat, но блин, как-то же должно оно работать? Не может же быть такого, что нельзя достучаться до файлов, которые лежат не в корне контейнера

11 ответов

6 просмотров

да у всех вложенные папки есть, лично по себе скажу, все нормально работает..

Евгений- Автор вопроса

Сразу заработало, или вы fs.ls делали?

Евгений
Сразу заработало, или вы fs.ls делали?

Без кластера Access Mode: Single User возможно не будет работать. Там для Shared надо тоже настройки смотреть.

Евгений- Автор вопроса

Мб кому-то будет полезно, решил проблему. Решение - не создавать volume на корень контейнера, а на каждую папку отдельно. Когда создал вольюм на container_name/2023 - все заработало

Евгений
Мб кому-то будет полезно, решил проблему. Решение ...

а можете кратко написать в чем профит использования volume'ов? Почему не писать и читать с фс?

Евгений- Автор вопроса
Vitaly Pismarev
а можете кратко написать в чем профит использовани...

Для non-tabular данных отлично подходят. Можно и в фс, но вольюмы работают с юнити каталогом, то есть не надо колдовать с секретами и пермишшенами - можете использовать managed identities

Евгений- Автор вопроса
Евгений
Для non-tabular данных отлично подходят. Можно и в...

https://www.databricks.com/blog/announcing-public-preview-volumes-databricks-unity-catalog

Евгений- Автор вопроса
Евгений
Для non-tabular данных отлично подходят. Можно и в...

У нас например десяток воркспейсов в датабриксе, меня эти бесконечные сервис принципалы и токены заколебали уже

Евгений
У нас например десяток воркспейсов в датабриксе, м...

А зачем так много воркспейсов? Каждой команде свой?

Евгений- Автор вопроса
Vitaly Pismarev
А зачем так много воркспейсов? Каждой команде свой...

По бизнес-доменам, да. Пытаемся в дата меш)

Похожие вопросы

Обсуждают сегодня

А если изначально бот работал так : есть сайт онлайн школы. У каждого ученика свой кабинет. Где он авторизуется по своим данным. И уже в кабинете, на самом сайте делает оплату...
Денис 💡 Фрилансер
13
что это и почему оно? executor.start_polling(bot, skip_updates=True, on_startup=on_startup, File "/usr/local/lib/python3.10/dist-packages/aiogram/utils/executor.py", line 4...
𐌍𐌄 ᕓ𐌄𐌓𐌌Ꝋ𐌓𐌄
2
Напомните пожалуйста, v1.1 работает на PHP 8.2?
Ross
7
А что насчет FluentValidation? тоже ведь есть альтернатива у МС.
devman
13
Ребят, всем привет) Кто юзал/юзает Postgres? Я на MySQL сделал простенький сайт для диплома, но я внезапно обнаружил условие что надо было на Postgres) Проблема в том, что я н...
Dororo Steeeve
4
Спасибо. Начну с клиент-сервер. Там разберусь И еще вопрос - можно ли как то джобы отправлять на определенные клиенты? Например есть vdi и linux машина. Можно ли задачу оправ...
Sergey Ivanov
4
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Всем привет! подскажите, кто-то использовал vault + гео-распределенный etcd-кластер (мемберы в разных цодах)? какие есть подводные камни? и стоит ли вообще такое делать?
Василиса Васильева
4
Тут кто-то шарит в мед оборудовании?
Benz
10
Диски перестали работать почему-то в Нидерландах тогда. 0кб в сек Никто как я понял не сможет посоветовать vds в Нидерландах ?
Stargrapefruit
16
Карта сайта