猿问

在python中计算图中的峰值数量

使用数据集df,我绘制了如下图:


df


Time    Temperature

8:23:04     18.5

8:23:04     19

9:12:57     19

9:12:57     20

9:12:58     20

9:12:58     21

9:12:59     21

9:12:59     23

9:13:00     23

9:13:00     25

9:13:01     25

9:13:01     27

9:13:02     27

9:13:02     28

9:13:03     28

图表(整体)

放大数据时,我们可以看到更多细节:

http://img3.mukewang.com/62d65a00000148da21450333.jpg

我想计算这个温度测量设备的激活次数,这会导致温度急剧上升。我已经定义了一个激活如下:

令 T0, T1, T2, T3 为时间 t=0,t=1,t=2,t=3 的温度,d0= T1-T0, d1= T2-T1, d2= T3-T2, ...是 2 个相邻值的差。

如果

1) d0 ≥ 0 且 d1 ≥ 0 且 d2 ≥ 0,并且

2) T2-T0 > max(d0, d1, d2),并且

3) T2-T0 < 30 秒

它被认为是一种激活。我想计算总共有多少次激活。有什么好方法可以做到这一点?

谢谢。


Qyouu
浏览 84回答 1
1回答

当年话下

取决于如何定义尖峰,可能会有许多不同的有效答案。假设您只想要温度显着升高的指数。一种简单的方法是只寻找超过某个阈值的非常大的值跳跃。阈值可以从数据的平均差中计算出来,这应该粗略估计值发生显着变化的位置。这是一个基本的实现:import numpy as np# Datax = np.array([0, 1, 2, 50, 51, 52, 53, 100, 99, 98, 97, 96, 10, 9, 8, 80])# Data diffxdiff = x[1:] - x[0:-1]# Find mean changexdiff_mean = np.abs(xdiff).mean()# Identify all indices greater than the meanspikes = xdiff > abs(xdiff_mean)+1print(x[1:][spikes])&nbsp; # prints 50, 100, 80print(np.where(spikes)[0]+1)&nbsp; # prints 3, 7, 15您也可以使用异常值拒绝,这比与均值差的基本比较要聪明得多。
随时随地看视频慕课网APP

相关分类

Python
我要回答