问答详情
源自:4-2 RDDs基本操作之Transformations(一)

这里面在map的时候,为什么不是把hello单词结果集写成(hello,2)呢?

这里面在map的时候,为什么不是把hello单词结果集写成(hello,2)呢?

提问者:度娘818 2017-07-20 09:52

个回答

  • Glacia1SugArLon
    2017-12-19 21:41:16

    这里的  map(word=>(word,1))  指的是将每一行中的单词进行统计,

    之后reduceByKey{case (x,y)=>x+y}方指将所有行中相同单词的个数进行统计

  • 笑拂
    2017-07-30 17:08:54

    从语法上来说,没问题。但是从语义上来说,为了计数,每个单词计数1次,同一词的计数相加得到出现的总次数,这是很自然的。若计数2次,为了得到总次数,相加后还要除2,这是没必要的。