我有一个在 Jupyter notebook 中运行的本地 Python 脚本,它在我的机器上运行的本地 Spark 集群上运行作业:
sc = pyspark.SparkContext(appName="test") sqlCtx = pyspark.SQLContext(sc)
如何将其更改为连接字符串以在 AWS 中的 EMR Spark 集群上运行作业?
这是可能的还是我必须spark-submit在 SSH 进入远程集群时使用该功能?
spark-submit
相关分类