我有两个数据框。
df1 包括 4 名男性和 4 名女性的体重和身高(英寸)。
#df1
John, 236, 76
Jack, 204, 74
Jim, 156, 71
Jared, 182, 72
Suzy, 119, 60
Sally, 149, 66
Sharon, 169, 65
Sammy, 182, 75
df2 包括 4 名男性和 4 名女性的体重和身高(英寸)。
#df2
Aaron, 285, 77
Abe, 236, 75
Alex, 178, 72
Adam, 195, 71
Mary, 148, 66
Maylee, 155, 66
Marilyn, 199, 65
Madison, 160, 73
我想要做的是让来自 df1 的男性与来自 df2 的男性进行比较,以根据身高和体重查看他们最喜欢的人。只需从体重中减去体重,从身高中减去身高,然后返回 df2 中每个人的绝对值。更具体地说,返回最相似的人的名字。
所以在这种情况下,约翰最接近的匹配是 Abe 所以在一个新的列 df1['doppelganger'] = "Abe"中。
我是一个初学者爱好者,所以即使指出我正确的方向也会有所帮助。我一直在查看堆栈溢出大约五个小时,试图弄清楚如何处理这样的事情。
米琪卡哇伊
相关分类