猿问

从pyspark中的字典列创建数据框

我想从 pyspark 中的现有数据帧创建一个新数据帧。数据框“df”包含一个名为“data”的列,该列具有字典行和字符串模式。并且每个字典的键是不固定的。例如,名称和地址是第一行字典的键,但对于其他行则不是这样,它们可能不同。以下是示例;


........................................................

  data 

........................................................

 {"name": "sam", "address":"uk"}

........................................................

{"name":"jack" , "address":"aus", "occupation":"job"}

.........................................................

如何使用如下所示的单个列转换为数据框。


 name   address    occupation

 sam       uk       

 jack      aus       job


喵喔喔
浏览 222回答 2
2回答
随时随地看视频慕课网APP

相关分类

Python
我要回答