在Apache Spark 2.0.0中,是否可以从外部数据库中获取查询(而不是获取整个表)?

使用pyspark:


from pyspark.sql import SparkSession


spark = SparkSession\

    .builder\

    .appName("spark play")\

    .getOrCreate()    


df = spark.read\

    .format("jdbc")\

    .option("url", "jdbc:mysql://localhost:port")\

    .option("dbtable", "schema.tablename")\

    .option("user", "username")\

    .option("password", "password")\

    .load()

与其获取“ schema.tablename”,不如获取一个查询的结果集。


红颜莎娜
浏览 489回答 2
2回答

缥缈止盈

与1.x中的相同,您可以传递有效的子查询作为dbtable参数,例如:....option("dbtable", "(SELECT foo, bar FROM schema.tablename) AS tmp")...
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

MySQL