в spark?
Суть: Есть поток данных в формате json из кафка топика, эти сообщения считываются spark streming джобой, парсится и кладется в таблицу. С некоторого времени, при не изменных параметрах джобы (jar, cluster info, spark-version, etc), часть данных перестало парситься (null значения ) для коллонки created (TimestampType). Пытался решить это тем, что колонку created в схеме сделал StringType - не помогло.
При этом, если эту же самую логику запустить через Databricks ноутбуки - данные парсятся нормально
В чем может быть проблема? (Грешил на изменения версий jar на стороне Dbx, но проверка - показало что не в этом проблема)
а точно версия кластера Databricks не изменялась? имею в виду Databricks Runtime
Обсуждают сегодня