我想从 pyspark 中的现有数据帧创建一个新数据帧。数据框“df”包含一个名为“data”的列,该列具有字典行和字符串模式。并且每个字典的键是不固定的。例如,名称和地址是第一行字典的键,但对于其他行则不是这样,它们可能不同。以下是示例;
........................................................
data
........................................................
{"name": "sam", "address":"uk"}
........................................................
{"name":"jack" , "address":"aus", "occupation":"job"}
.........................................................
如何使用如下所示的单个列转换为数据框。
name address occupation
sam uk
jack aus job
相关分类