继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

史上最快! 10小时大数据入门实战(九)- 前沿技术拓展Spark,Flink,Beam

蝴蝶刀刀
关注TA
已关注
手记 412
粉丝 38
获赞 184

5bcf21190001fc9210000314.jpg


5bcf211b000116cf10000410.jpg

spark

5bcf211b0001d88a10000603.jpg


5bcf211d0001182610000271.jpg


5bcf211e0001f35a10000579.jpg


5bcf2120000197d510000482.jpg


5bcf212100010e8510000425.jpg


5bcf212400011dd910000550.jpg


5bcf21240001bc6410000430.jpg

Spark 开发语言及运行模式介绍

5bcf2125000197c010000372.jpg


1000

Scala安装

1000

下载 Scala


996

配置到系统环境变量


1000

配置成功

Spark环境搭建及 wordCount 案例实现

1000

下载 spark


1000

解压编译


1000

spark-shell可执行程序


如何提交应用程序


1000


开启2个即可

1000


1000

./spark-shell --master local[2]


读取输出文件内容


1000


1000


1000

3行数据


按空格拆分

1000


为每个单词赋1,表出现频率

1000

a.map(word => (word,1))


统计

1000


以上操作其实通过一条方法链即可完成!!!


1000

sc.textFile("file:///Volumes/doc/data/hello.txt").flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_).collect


GUI 管理界面

1000

访问该地址即可


1000

http://localhost:4040

Flink 概述

使用 Flink 完成 wordcount 统计

Flink 环境部署

1000

下载


1000

下载镜像到本地


1000

解压


查看官网指南


1000


启动本地的一个 flink

1000


1000


1000

浏览器访问:http://localhost:8081/


使用方法


1000

Beam 概述

将 wordCount的 Beam 程序以多种不同 Runner运行

Java 版本快速入门指南


1000


1000


1000

maven 命令执行成功


1000

运行命令


1000


1000

生成文件


1000

查询结果



作者:芥末无疆sss
链接:https://www.jianshu.com/p/4d0341a4d7d7
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。


打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP