这里面在map的时候,为什么不是把hello单词结果集写成(hello,2)呢?

来源:4-2 RDDs基本操作之Transformations(一)

度娘818

2017-07-20 09:52

这里面在map的时候,为什么不是把hello单词结果集写成(hello,2)呢?

写回答 关注

2回答

  • Glacia1SugArLon
    2017-12-19 21:41:16

    这里的  map(word=>(word,1))  指的是将每一行中的单词进行统计,

    之后reduceByKey{case (x,y)=>x+y}方指将所有行中相同单词的个数进行统计

  • 笑拂
    2017-07-30 17:08:54

    从语法上来说,没问题。但是从语义上来说,为了计数,每个单词计数1次,同一词的计数相加得到出现的总次数,这是很自然的。若计数2次,为了得到总次数,相加后还要除2,这是没必要的。

    Glacia...

    能否详细说明一下原理

    2017-12-19 21:34:01

    共 1 条回复 >

Spark从零开始

本课程旨在让同学们了解Spark基础知识,掌握Spark基础开发.

52724 学习 · 81 问题

查看课程

相似问题