Кафка топика.
Правильно я понимаю? Если есть топик на 11 партиций спарк максимум распараллелит процессинг этого топика на 11 задач
Гуглите fan-out паттерн
minPartitions [Optional] Minimum number of partitions to read from Kafka. With Spark 2.1.0-db2 and above, you can configure Spark to use an arbitrary minimum of partitions to read from Kafka using the minPartitions option. Normally Spark has a 1-1 mapping of Kafka topicPartitions to Spark partitions consuming from Kafka. If you set the minPartitions option to a value greater than your Kafka topicPartitions, Spark will divvy up large Kafka partitions to smaller pieces
Как понимать "divvy up large Kafka partitions to smaller pieces"? Одна партиция может читаться несколькими задачами?
Обсуждают сегодня