我已经在 Scala 中学习了 Spark,但我对 pySpark 和 AWS Glue 非常陌生,
所以我遵循了 AWS 的这个官方教程。
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/aws-glue-programming-python-samples-legislators.html
我成功创建了开发端点,
通过 ssh 连接到 pyspark REPL 并输入以下命令:
import sys
from awsglue.transforms import *
from awsglue.utils import getResolvedOptions
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.job import Job
glueContext = GlueContext(SparkContext.getOrCreate())
但在最后一行,我得到了
>>> glueContext = GlueContext(SparkContext.getOrCreate())
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/share/aws/glue/etl/python/PyGlue.zip/awsglue/context.py", line 44, in __init__
File "/usr/share/aws/glue/etl/python/PyGlue.zip/awsglue/context.py", line 64, in _get_glue_scala_context
TypeError: 'JavaPackage' object is not callable
我也尝试过手动导入 py4j,但是没有用。
我怎样才能解决这个问题?
任何小帮助将不胜感激。
慕运维8079593
相关分类