а затем надо будет показать себя крутым на собеседовании в проект, где это используется. Можете поделиться, пожалуйста, из своего опыта какими-нибудь вариантами использования, способами работы с ним, курьёзными случаями при использовании, вопросами, которые могут спросить о нём на собесе? 🙏
Это мне для лучшего усвоения теоретического материала
Две недели много, за это время можно доку наизусть выучить. Поднять кубер, сделать пайплайн. Реальные проблемы которые встретишь спросишь в чате
Если теор.материал у тебя уже есть, то попробуй вот так структурировать подготовку: 1. Stateless processing - это фильтр, простейшие трансформации 1 рекорда. Windows тут не нужнв 2. Stateful - агрегации на окошках. Тут постарайся не утонуть в кучах вариаций этих окошек 3. Stateful - джойны на table api 4. Stateful хрень на более низком уровне - data stream api https://nightlies.apache.org/flink/flink-docs-release-1.17/docs/dev/datastream/operators/overview/ У них еще есть хандс-он прямо из доки https://nightlies.apache.org/flink/flink-docs-release-1.17/docs/learn-flink/overview/
Самые типичные боли - изменения структуры всяких стейтов. Особенно когда стейты разрастаются до 1ТБ
Спасибо большое!
А когда их менять требуется?
Например, когда вместо трех сурсов надо теперь джойнить четыре Или в серединку между трансформациями воткнуть еще одну Почитай про https://nightlies.apache.org/flink/flink-docs-master/docs/dev/datastream/fault-tolerance/serialization/schema_evolution/ Software is never done
Обсуждают сегодня