прям понимать то, что внутри крутится.
Из требований год спарка и кафки.
До этого к спарку только sql запросы писал и препроцессил чуть чуть данные.
Написать сложный запрос с джойнами и оконками, посмотреть в spark ui и каждый синий квадратик загуглить
ну и к тому что женя написал добавь (пролистай их) https://jaceklaskowski.gitbooks.io/mastering-apache-spark/content/ https://jaceklaskowski.gitbooks.io/mastering-spark-sql/content/
Обсуждают сегодня