Spark从零开始_技术笔记_课程笔记

熊手拉猫手 2023-03-21

spark 基于 scala 运行在 jvm 环境中 1.7版本以上
spark 不依赖 hadoop
目录：
    bin 可执行文件
    core streaming python 包含组件源代码
    examples 包含单机 job 例子，以供研究

执行命令：
./spark-shell (等待时间较长)
在执行成功后可看到 scala> 提示符，然后就可以使用 python 进行交互了

0赞 · 0采集
霜花似雪 2022-11-06

spark的运行环境：
    基于Scala ,运行在JVM，运行环境Java7+
spark下载：
    搭建spark不需要Hadoop，下载后解压
    虚拟机（Linux）联网状态下，通过 wget+下载链接
    Linux解压命令 tar -zxvf spark.....
spark目录
    bin目录-可执行文件
    core，streaming主要包含组件源代码
    examples 包含单机例子
spark的shell:
    梳理分布在集群上的数据
    可以将数据加载到节点的内存中，因此分布式处理可在秒级完成。
    快速迭代计算，实时查询、分析
    spark提供了Python shell和Scala shell
Scala shell
    /bin/spark-shell

0赞 · 0采集
慕粉1446071354 2020-05-24

Spark下载，安装；
Spark Shell操作

0赞 · 1采集
BridgetMa 2019-11-14

spark不具有hdfs一样的持久化数据的能力，需要借助hdfs存储数据

截图
0赞 · 0采集
xyx8888 2019-08-08

Spark Shell

截图
0赞 · 0采集
gongwanyi 2019-08-04

复制模板文件，修改参数

截图
0赞 · 0采集
gongwanyi 2019-08-04

Spark举例说明

截图
0赞 · 0采集
gongwanyi 2019-08-04

举例说明：

截图
0赞 · 0采集
gongwanyi 2019-08-04

Scala Shell:

截图
0赞 · 0采集
gongwanyi 2019-08-04

Python Shell

截图
0赞 · 0采集
gongwanyi 2019-08-04

Spark的Shell

截图
0赞 · 0采集
gongwanyi 2019-08-04

Spark目录

截图
0赞 · 0采集
gongwanyi 2019-08-04

Spark下载

截图
0赞 · 0采集
gongwanyi 2019-08-04

Spark运行环境

截图
0赞 · 0采集
一只藏獒 2019-04-23

spark的运行环境：
    基于Scala ,运行在JVM，运行环境Java7+
spark下载：
    搭建spark不需要Hadoop，下载后解压
    虚拟机（Linux）联网状态下，通过 wget+下载链接
    Linux解压命令 tar -zxvf spark.....
spark目录
    bin目录-可执行文件
    core，streaming主要包含组件源代码
    examples 包含单机例子
spark的shell:
    梳理分布在集群上的数据
    可以将数据加载到节点的内存中，因此分布式处理可在秒级完成。
    快速迭代计算，实时查询、分析
    spark提供了Python shell和Scala shell
Scala shell
    /bin/spark-shell

1赞 · 0采集
慕慕3232729 2019-03-13

python-shell scala-shell

截图
0赞 · 0采集
T_Boy 2018-12-02

Spark不具有HDFS的存储能力。

0赞 · 0采集
凡简 2018-11-27

Spark下载安装

截图
0赞 · 0采集
凡简 2018-11-27

Spark运行环境

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

课程小结

sprak下载、安装

spark shell操作

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

spark安装

如何修改日志级别【找到log4j.properties,如果不是，则应该拷贝log4j.properties.temp。。。文件，命名为log4j.properties，之后再修改日志级别即可。】
log4j.rootCategory=WARN,console

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

spark 安装

例子：
如何加载文件并对文件进行相关的操作。

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

spark 安装

scala shell：
bin/spark-shell

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

spark安装

python shell：
bin/pyspark

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

spark安装

spark的shell，
处理分布在集群上的数据。

spark把数据加载到节点的内存中，因此分布式处理可在秒级完成。

快速使迭代式计算、实时查询、分析一般能够在shells中完成。

提供python shells和Scala shells。

截图
0赞 · 0采集
慕婉清5038615 2018-10-16

spark安装

spark目录介绍

截图
0赞 · 0采集
慕婉清5038615 2018-10-15

spark的安装，

spark下载：http://spark.apache.org/downloads.html

搭建spark不需要Hadoop，如有Hadoop集群，可下载相应的Hadoop对应的spark安装即可。

截图
0赞 · 0采集
慕婉清5038615 2018-10-15

spark的安装【必须手动安装，原来scala写的spark是运行在jvm上的。】

截图
0赞 · 0采集
慕用2516153 2018-10-12

安装版本要求：
Spark1.6.2 - Scala 2.10
Spark2.0.0 - Scala 2.11
wget https://archive.apache.org/dist/spark/spark-2.3.2/spark-2.3.2-bin-hadoop2.6.tgz
解压：tar -zxvf sp.....
下载Scala: wget https://downloads.lightbend.com/scala/2.10.5/scala-2.10.5.tgz
解压：tar -zxvf xxxxxx
之后下载：IntelliJ IDEA https://www.jetbrains.com/idea/
IntelliJ IDEA注册码：http://idea.lanyus.com/

0赞 · 0采集
慕勒1296595 2018-09-08

把数据加载到节点的内存中，使得分布式处理在秒级完成

0赞 · 0采集

数据加载中...