Spark从零开始_技术笔记

熊手拉猫手 2023-03-21

hadoop 缺点：离线处理，导致时效性差，几分钟几小时为单位
spark 有点：时效性高，在内存里进行

0赞 · 0采集
霜花似雪 2022-11-06

Hadoop应用场景：离线处理、对时效性要求不高（执行时间几分钟到几小时不等）；
Spark应用场景：时效性要求高的场景、机器学习等领域。

两者比较：
这是生态系统，每个组件都有其作用，各善其职即可；
Spark不具有HDFS的存储能力，要借助HDFS等持久化数据；
大数据将会孕育出更多的新技术

0赞 · 0采集
Jason_小杰 2021-08-28

spark与hadoop
spark计算时效：几秒钟、几分钟
存储：基于内存计算，需要借助hdfs持久化数据

0赞 · 0采集
慕粉1446071354 2020-05-24

Hadoop应用场景：离线处理、对时效性要求不高（执行时间几分钟到几小时不等）；
Spark应用场景：时效性要求高的场景、机器学习等领域。
两者比较：
这是生态系统，每个组件都有其作用，各善其职即可；
Spark不具有HDFS的存储能力，要借助HDFS等持久化数据；
大数据将会孕育出更多的新技术

0赞 · 0采集
慕少7317271 2020-03-15

Hadoop适合处理离线的静态的大数据
Spark适合处理离线的流式的大数据
Storm适合处理在线的实时的大数据

0赞 · 0采集
第二组 2019-10-29

这里还可以写笔记啊

0赞 · 0采集
xyx8888 2019-08-08

Spark对比Hadoop(2)

截图
0赞 · 0采集
xyx8888 2019-08-08

Spark对比Hadoop(1)

截图
0赞 · 0采集
gongwanyi 2019-08-04

Hadoop与Spark的比较

截图
0赞 · 0采集
gongwanyi 2019-08-04

Spark应用场景
1、时效性要求高的场景
2、机器学习领域

截图
0赞 · 0采集
gongwanyi 2019-08-04

Hadoop应用场景
1、离线处理
2、对时效性要求不高。

截图
0赞 · 0采集
一只藏獒 2019-04-23

spark与Hadoop的比较
Hadoop的应用场景：离线处理，对时效性要求不高
spark的应用场景：对时效性要求高，机器学习领域

0赞 · 0采集

weixin_慕的地6245420 2019-04-07

Hadoop适合处理离线的静态的大数据
Spark适合处理离线的流式的大数据
Storm适合处理在线的实时的大数据

0赞 · 0采集

凡简 2018-11-27

Hadoop之父 Doung Cutting的观点

截图
0赞 · 0采集
凡简 2018-11-27

Hadoop和Spark比较
Spark应用场景
Spark是基于内存的，中间数据尽量的不落在硬盘上，尽量存储在内存中，大大加快了Spark运算的计算速度

截图
0赞 · 0采集
凡简 2018-11-27

Hadoop和Spark比较
Haoop应用场景

截图
0赞 · 0采集
慕婉清5038615 2018-10-15

spark和Hadoop的比较，各善其职即可。

spark不具有hdfs的存储能力，要借助hdfs等持久化数据。

截图
0赞 · 0采集
慕婉清5038615 2018-10-15

spark应用场景

基于内存处理，时效性要求很高，处理时间在几秒钟到几分钟不等。

截图
0赞 · 0采集
慕婉清5038615 2018-10-15

Hadoop应用场景

中间处理结果会存在硬盘上，处理时间在几分钟到几小时不等。

截图
0赞 · 0采集
慕粉1470546789 2018-09-24

20180924:讲的非常一般，看了十分钟，不想继续了，先放着吧。

0赞 · 0采集
维维要加油 2018-07-12

Spark和Hadoop的比较
Hadoop应用场景：离线处理、对时效性要求不高，因为hadoop的中间数据在硬盘上
Spark应用场景：时效性要求高的场景&机器学习
两者都是拥有完整的生态系统，每个组件都有其作用，各善其职；
Spark不具有HDFS的存储能力，要借助HDFS等持久化数据

0赞 · 0采集
246ba 2018-06-24

hadoop 离线处理实时性要求不高的场景，中间计算数据存储在磁盘，处理时间分钟-小时
spark 即时处理实时性要求高的场景，中间计算数据存储在内存，处理时间秒-分钟

2赞 · 0采集
慕的地522374 2018-05-11

截图
0赞 · 0采集
Sunny_WangTy 2018-03-10

Spark的比较

截图
0赞 · 0采集
暗淡蓝点6730 2018-01-04

Hadoop&Spark比较 Hadoop应用场景：离线处理，时效性要求不高的场景：Hadoop中间数据落到硬盘上，导致Hadoop处理大数据时，时效性不高，时间在几分钟到几小时不等，但数据可以存储。 Spark应用场景：时效性要求高的场景和机器学习：Spark基于内存，中间数据多在内存中，数据处理块，但Spark不具备hdfs存储功能，需借助hdfs Doug Cutting 的观点： spark这是个生态系统，每个组件都有其作用，各姗其职即可， Spark不具有HDFS的存储能力，要借助HDFS等持久数据大数据将会孕育出更多的新技术

截图
0赞 · 2采集
猛猛小蚂蚁 2017-12-04

Doug Cutting 的观点： spark这是个生态系统，每个组件都有其作用，各姗其职即可， Spark不具有HDFS的存储能力，要借助HDFS等持久数据大数据将会孕育出更多的新技术

0赞 · 1采集
猛猛小蚂蚁 2017-12-04

Spark时效性高，基于内存反应在几秒

0赞 · 0采集
猛猛小蚂蚁 2017-12-04

Hadoop 离线处理、时效性要求不高

0赞 · 0采集
慕雪514669 2017-11-23

spark

截图
0赞 · 0采集
程前VIP 2017-09-27

Hadoop应用场景：离线处理，时效性要求不高的场景：Hadoop中间数据落到硬盘上，导致Hadoop处理大数据时，时效性不高，时间在几分钟到几小时不等，但数据可以存储。 Spark应用场景：时效性要求高的场景和机器学习：Spark基于内存，中间数据多在内存中，数据处理块，但Spark不具备hdfs存储功能，需借助hdfs

0赞 · 0采集

数据加载中...