Spark 数据帧 使用 Python 列列表进行选择

我有一个蟒蛇列列表

col_list = [name, age, address.city, address.street, address.zipcode, address.state]这是我在Pyspark中选择的。

df = df.select(*[col(c) for c in col_list]).alias(c.replace('.', '_'))

上面的语句创建了一个包含列名称的平面数据帧 - 名称,年龄,城市,街道,邮政编码,州,但我需要列名称,如 - address_city,address_street,address_zipcode,address_state。

任何建议。


动漫人物
浏览 66回答 1
1回答

月关宝盒

丰df = df.select(*[F.col(c).alias(c.replace('.', '_')) for c in col_list])
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python