我有两个数据框。第一个数据帧df包含 5 分钟(返回)数据和索引的小时和分钟
import pandas as pd
dates = pd.date_range(start='2018-01-01', end='2018-01-05', freq='5T')
df = pd.DataFrame(np.random.randn(len(dates),1), index=dates, columns=list(['Ret']))
df['Hour'] = df.index.hour
df['Minute'] = df.index.minute
tmp = df['Ret'].groupby([df['Hour'],df['Minute']]).mean().to_frame()
所以现在tmp包含一个多索引数据帧,它有两个级别的小时和分钟。我现在想要做的是创建一个新列,在df其中我从数据框中选择正确的值tmp并将它们放回df数据框中。
所以基本上我想df通过查找df['Hour']和df['Minute']输入tmp并返回正确的值来创建一个新列,但我似乎无法让它工作。
幕布斯7119047
相关分类