current_timestamp()). Почему при печатании схемы показывает date как nullable?Спарк 3
🤷♂ А почему это важно?
Есть логика которая сверяет схемы
А после записи в паркет получается nullable? Или тебе важно чтобы именно схема датафрейма 100% совпадала? В спарке не может быть ничего non null, нет возможности это гарантировать Поэтому я часто принудительно нуллифицирую, чтобы не создавать опасных иллюзий для downstreams В hive вообще все optional В частности, добавить non null столбик с дефолтом как в sql невозможно При чтении спарк тоже все читает как nullable даже если в поркетах оно required
Обсуждают сегодня