度娘818
2017-07-20 09:52
这里面在map的时候,为什么不是把hello单词结果集写成(hello,2)呢?
这里的 map(word=>(word,1)) 指的是将每一行中的单词进行统计,
之后reduceByKey{case (x,y)=>x+y}方指将所有行中相同单词的个数进行统计
从语法上来说,没问题。但是从语义上来说,为了计数,每个单词计数1次,同一词的计数相加得到出现的总次数,这是很自然的。若计数2次,为了得到总次数,相加后还要除2,这是没必要的。
Spark从零开始
52741 学习 · 81 问题
相似问题