继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

spark word count环境搭建(scala)

青春有我
关注TA
已关注
手记 1244
粉丝 205
获赞 1011

安装InteliJ软件

新建工程,如下图

webp

屏幕快照 2018-12-26 23.16.31.png

配置build.sbt

name := "ScalaHelloWorld"version := "1.0"scalaVersion := "2.12.2"libraryDependencies += "org.apache.spark" %% "spark-sql" % "2.4.0"

这里的scala版本需要与系统安装的一致,否则后面sbt编译会报错。
lib依赖配置了,sbt会自动下载需要的包。

准备数据

例如如下简单的文本

hello word count hello

新建scala object

package com.helloimport org.apache.spark.{SparkConf, SparkContext}

object wordCount {  def main(args: Array[String]): Unit = {
    val conf = new SparkConf()
      .setMaster("local")
      .setAppName("wordCount")
    val sc = new SparkContext(conf)
    val data = sc.textFile("./example.txt")
    val result = data.flatMap(_.split(" "))
      .map((_,1))
      .reduceByKey(_+_)
      .collect()

    result.foreach(println)

  }

}

运行


webp

屏幕快照 2018-12-26 23.35.11.png


结果如下


webp

屏幕快照 2018-12-26 23.36.14.png


这就是spark word count的最简单的入门环境了。



作者:霖雨07
链接:https://www.jianshu.com/p/0d9613dae620


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP