假设我现在有一个在日期 (df['DT']) 和 ID (df['ID']) 中多重索引的 df
DT,ID,value1,value2
2020-10-01,a,1,1
2020-10-01,b,2,1
2020-10-01,c,3,1
2020-10-01,d,4,1
2020-10-02,a,10,1
2020-10-02,b,11,1
2020-10-02,c,12,1
2020-10-02,d,13,1
df = df.set_index(['DT','ID'])
现在,我想将 df 扩展为“2020-10-03”和“2020-10-04”,其 ID {a,b,c,d} 集与我的预测期相同。为了预测值 1,我假设它们将取现有值的平均值,例如对于 2020-10-03' 和 '2020-10-04' 中 a 的 value1,我假设它将取 (1+10)/2 = 5.5。对于值 2,我假设它将保持恒定为 1。
预期的 df 将如下所示:
DT,ID,value1,value2
2020-10-01,a,1.0,1
2020-10-01,b,2.0,1
2020-10-01,c,3.0,1
2020-10-01,d,4.0,1
2020-10-02,a,10.0,1
2020-10-02,b,11.0,1
2020-10-02,c,12.0,1
2020-10-02,d,13.0,1
2020-10-03,a,5.5,1
2020-10-03,b,6.5,1
2020-10-03,c,7.5,1
2020-10-03,d,8.5,1
2020-10-04,a,5.5,1
2020-10-04,b,6.5,1
2020-10-04,c,7.5,1
2020-10-04,d,8.5,1
感谢您的帮助和时间。
白板的微信
相关分类