spark-streaming-kafka-0-8 vs spark-streaming

我是大数据领域的新手,我需要做一个演示,使用火花流从Kafka主题流式传输数据,然后进行一些聚合和过滤,然后保存这些数据。我正在使用spark 2.3,我需要知道哪个版本的spark stream Kafka必须使用0.8或10,如spark-2.3文档->

https://spark.apache.org/docs/2.3.0/streaming-kafka-integration.html 提到

http://img4.mukewang.com/62fc9cc5000188db08720148.jpg

0.8 已弃用,10 是稳定的,但在流-kafka-0-10-集成中->

https://spark.apache.org/docs/2.3.0/streaming-kafka-0-10-integration.html

http://img.mukewang.com/62fc9cd00001234509590181.jpg

提到0.8是稳定的,10是实验性的,我使用的是Kafka 2.1。

所以我必须使用其中的哪一个


拉莫斯之舞
浏览 107回答 2
2回答

呼如林

我使用的是Kafka 2.1。然后,您应该使用Spark的0.10 Kafka API,主要是因为拥有新的消费者API,如该页面所述。如果升级到 Spark 2.4,则同一库已升级为使用 Kafka 2.0 库,但它们将名称保留为 0.10 - SPARK-18057

烙印99

版本 0.8 是稳定的,但 kafka 不为此版本提供技术支持。我认为,您应该继续使用最新版本。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java