в managed таблицу?
Проблема такая, что есть таблица вида:
root
|-- group: struct (nullable = true)
| |-- ord: string (nullable = true)
| |-- user_exps: array (nullable = true)
| | |-- element: long (containsNull = true)
| |-- user_variants: array (nullable = true)
| | |-- element: long (containsNull = true)
|-- event_date: string (nullable = true)
И часто возникает задача в структуру group добавлять новые поля, но я не нашел способа как это сделать (через spark 3.2)
Если это не добавить, то какой паттерн лучше всего? Хранить вторую табличку с key value значениями для этой структуры?
Насколько я помню, в спарке DDL позволял только сделать replace всей структуры целиком. Хайвовским DDL можно столбик добавить В целом в предыдущем опыте я всегда старался уменьшить к-во таких штук в target таблицах, куда спарк пишет. Аррау - эксплоде, а структы - в плоские столбики типа attributes_address, attributes_first_date, ... От вложенной херни одни проблемы.
Мы напрямую в постгресе меняем самописным мигратором
Обсуждают сегодня