pandas,根据最近的日期选择性加入

我有一个数据框 X,其中包含以下内容


Index       A         B

2020-09-08  0.252167  0.263719  

2020-09-05  0.266898  0.270347

2019-09-04  0.254873  0.273878  

我有另一个数据框 Y,其中包含以下内容


Index       C

2021-09-08  0.252167   

2015-09-05  0.266898  

对于 Y 中的每一行,我希望有效地选择 X 中最近的行并将它们连接在一起。这里的“最近”是索引的函数,即:哪个日期更接近。


在这种情况下,应该会返回。


Index       Index2     C          A         B

2021-09-08  2020-09-08 0.252167   0.252167  0.263719  

2015-09-05  2019-09-04 0.266898   0.254873  0.273878 

(注意:两个索引都是日期时间对象)


由于2020-09-08最接近2021-09-08,2019-09-04最接近2015-09-05。


我可以通过迭代 Y 的每个索引并调用来做到这一点


X.index.get_loc(currentYIndex, "最近的")


有没有更有效的方法来做到这一点?


慕田峪7331174
浏览 84回答 1
1回答

隔江千里

需要更多细节df1['Index2']=df1['Index']Out = pd.merge_asof(df2.sort_values('Index'),                     df1.sort_values('Index'),                     on = 'Index',                     direction = 'nearest',                     allow_exact_matches = False)Out[33]:        Index         C         A         B     Index20 2015-09-05  0.266898  0.254873  0.273878 2019-09-041 2021-09-08  0.252167  0.252167  0.263719 2020-09-08
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python