如果行匹配,则PySpark设置列值等于另一个数据框值

嗨,我想检查spark数据框列值,并基于检查行名是否与另一个数据框行匹配来设置它。


例子:


df1:

average name

3.5      n1

1.2      n2

4.2      n3


df2:

name    

n1     

n1        

n1    

n2

n3

n1

n2

n3

n3


df_i_want:

average name

3.5      n1

3.5      n1

3.5      n1

1.2      n2

4.2      n3

3.5      n1

1.2      n2

4.2      n3

4.2      n3


米琪卡哇伊
浏览 186回答 2
2回答

万千封印

您需要做的只是 Join您可以实现如下所示的结果。df2使用df1on连接数据框,name然后选择所需的列顺序df3 = df2.join(df1, on = 'name').select('average', 'name')上面的代码段应为您提供理想的结果
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python