我有一个 CSV 文件:
_id,ltp,volume,time
5f4dde2e9f742701e3d9a15c,214.55,29077675,2020-09-01T11:07:50.000Z
5f4dde2f9f742701e3d9a15d,214.55,29077690,2020-09-01T11:07:50.000Z
5f4dde2f9f742701e3d9a15e,214.65,29077690,2020-09-01T11:07:51.000Z
5f4dde309f742701e3d9a15f,214.65,29077900,2020-09-01T11:07:51.000Z
5f4dde309f742701e3d9a160,214.6,29077900,2020-09-01T11:07:52.000Z
5f4dde319f742701e3d9a161,214.7,29078191,2020-09-01T11:07:53.000Z
5f4dde329f742701e3d9a162,214.6,29078769,2020-09-01T11:07:54.000Z
5f4dde339f742701e3d9a163,214.65,29078832,2020-09-01T11:07:55.000Z
我需要OHLC根据给定时间间隔的数据计算 。open是区间中的第一个元素,high是最大值,low是最小值,close是最后一个。
这是通过以下类似的代码实现的:
data = df.resample('1T').agg({'ltp': ['first', 'max', 'min', 'last'], 'volume': 'sum'})
问题 1:我无法将 open、high、low、close 列与上面的代码分开,它位于“ltp”列内。为了访问open我需要写data['ltp']['first']。(不过这是一个小问题,可以忽略)
问题2:主要问题是当前计算时volume我有sum,但实际上我想要实现的是这个,例如volumeat 10:01:00is100和at is10:02:00所以200该时间范围的总体积是200-100 = 100,我怎样才能实现这个?
一只甜甜圈
相关分类