Spark 快速且通用的集群计算平台
-快速,比hadoop快,基于内存的 MapReduce(计算结果中间数据在内存中)
-通用,应用场景更多,批处理,迭代计算,交互查询,流处理
由 scala 语言编写,但是 python java 也支持
Spark快速且通用的集群计算平台
➢ spark是快速的
○ Spark扩充了流行的Mapreduce计算模型
○ Spark是基于内存的计算
➢ spark是通用的
○ 容纳了其他分布式系统拥有的功能:批处理、迭代式计算、交互查询和流处理等,方便维护
○ 优点:降低了维护成本
➢ spark是高度开放的
○ Spark提供了Python,Java,Scala,SQL的API和丰富的内置库。
○ Spark和其他的大数据工具整合的很好,包括hadoop,kafka等。
1、Spark是一个快速且通用的集群计算平台
2、Spark是快速的
Spark扩充了流行的MapReduce计算模型
Spark是基于内存的计算
3、Spark是通用的
Spark的设计容纳了其他分布式系统拥有的功能
批处理、迭代式计算、交互查询和流处理等
优点:降低了维护成本
4、Spark是高度开放的
Spark提供了Python、Java、Scala、SQL的API和丰富的内置库
Spark和其他的大数据工具整合的很好,包括Hadoop、kafka等
spark是快速的
Spark扩充了流行的Mapreduce计算模型
Spark是基于内存的计算
spark是通用的
容纳了其他分布式系统拥有的功能:批处理、迭代式计算、交互查询和流处理,方便维护
优点:降低了维护成本
spark是高度开放的
提供了python、java、scala、SQL的API和丰富的内置库(Scala是spark的原生语言)
和其他的大数据工具整合的很好,包括hadoop、kafka等
Spark的含义:是一个快速且通用的集群计算平台
Spark的特点:
spark是快速的
Spark扩充了流行的Mapreduce计算模型
Spark是基于内存的计算
spark是通用的
容纳了其他分布式系统拥有的功能:批处理、迭代式计算、交互查询和流处理,方便维护
优点:降低了维护成本
spark是高度开放的
提供了python、java、scala、SQL的API和丰富的内置库(Scala是spark的原生语言)
和其他的大数据工具整合的很好,包括hadoop、kafka等
Spark学习要点
spark是高度开放的, 与其他大数据工具整合很好
spark是快速&通用的
Spark课程大纲
spark 是一个快速且通用的集群计算平台
基于内存的运算
通用性;降低维护成本
spark是高度开放的;Python Java scala haddoop
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。
Spark的含义:是一个快速且通用的集群计算平台
Spark的特点:
spark是快速的
spark是通用的
spark是高度开放的
Spark的特点 高度开放
Spark的特点
Spark的特点
Spark简介
Spark课程大纲
spark课程大纲,需要动手搭建一套spark大数据平台
spark是高度开放的,能很好的整合Hadoop、kafka等
spark是通用的,不用再单独搭建批处理、交互查询和流处理等,即包括了Hadoop和sorm等功能。
大数据 spark的特点
Spark
快速且通用的集群计算平台
特点:
快速:
扩充了流行的MR计算模型(如MR是分/时计算,那么Spark就是秒/分及计算)
基于内存的计算(计算过程难免产生中间结果,中中间结果放在内存比硬盘快很多)
通用:
容纳了其他分布式系统拥有的功能
包括批处理(如Hadoop),迭代式计算(其他机器学习系统),交互式查询(如hive)和流处理(如stom)
优点:大量降低了维护成本;
高度开放:
提供了python、java、scala、sql的api和丰富的内置库;
和其他的大数据工具整合的很好,包括hadoop、kafka等等
