我有一个熊猫的数据框,填充如下:
ref_date tag
1/29/2010 1
2/26/2010 3
3/31/2010 4
4/30/2010 4
5/31/2010 1
6/30/2010 3
8/31/2010 1
9/30/2010 4
12/31/2010 2
请注意数据中如何缺失月份(即 7、10、11)。我想通过前向填充方法填充缺失的数据,使其看起来像这样:
ref_date tag
1/29/2010 1
2/26/2010 3
3/31/2010 4
4/30/2010 4
5/31/2010 1
6/30/2010 3
7/30/2010 3
8/31/2010 1
9/30/2010 4
10/29/2010 4
11/30/2010 4
12/31/2010 2
缺少日期的标签将具有前一个. 所有日期都代表该月的最后一个工作日。
这就是我试图做的:
idx = pd.date_range(start='1/29/2010', end='12/31/2010', freq='BM')
df.ref_date.index = pd.to_datetime(df.ref_date.index)
df = df.reindex(index=[idx], columns=[ref_date], method='ffill')
它给了我错误:
类型错误:无法将“时间戳”类型与“int”类型进行比较
哪里pd是熊猫,df是数据框。
我是 Pandas Dataframe 的新手,所以任何帮助将不胜感激!
相关分类