问答详情
源自:4-7 KeyValue对RDDs(二)

请问combineByKey求平均值的时候为什么有c1 c2两个partition

http://img.mukewang.com/5aa52a870001837810720208.jpg

怎么确定有几个分片

提问者:慕粉0058038984 2018-03-11 21:10

个回答

  • 贝加尔湖畔v
    2018-03-18 13:48:33

    c1和c2不是代表只有两个partition,可以把这两个当做输入的参数,类似于reduce函数。c1代表前几个partition已经累计计算到的值,c2代表新partition的值。