оптимизация "за сценой" ?
Нет
да нет там никакой магии ) Есть возможность настроить автоптимайз и файлики будут компактится как бы в фоне
оптимизация происходит во время работы с таблицей. Об этом и речь когда читаем "Databricks manages both the metadata and the data for a managed table" здесь
о какой оптимизации идёт речь?
да можно пояснительную бригаду. Там только одно предложение без конкретики. Как именно metadata обрабатывается дополнительно.
вот тут если интересно можно почитать про то как устроен лог https://www.databricks.com/blog/2019/08/21/diving-into-delta-lake-unpacking-the-transaction-log.html лог по сути и есть метастор и сингл соурз оф труф, в этом и есть отличие от хайвовых таблиц.
https://docs.databricks.com/delta/tune-file-size.html#auto-compact "For Unity Catalog managed tables, Databricks tunes most of these configurations automatically"
Обсуждают сегодня