猿问

使用传感器时间序列预测故障的最佳模型

我正在与一家公司合作开发用于预测性维护的 ML 模型。我们拥有的数据是日志文件的集合。在每个日志文件中,我们都有来自传感器(温度、压力、MototSpeed 等)的时间序列和我们记录发生的故障的变量。此处的目的是构建一个模型,该模型将使用日志文件作为其输入(时间序列)并预测是否会出现故障。为此,我有一些问题:1)能够做到这一点的最佳模型是什么?2)处理不平衡数据的解决方案是什么?事实上,对于某种故障,我们没有足够的数据。在将时间序列转换为固定长度的子时间序列后,我尝试使用 LSTM 构建一个 RNN 分类器。如果有故障,则目标为 1,否则为 0。与零的数量相比,1 的数量可以忽略不计。结果,模型总是预测为0。解决办法是什么?



POPMUISE
浏览 127回答 1
1回答

慕少森

Mohamed,对于这个问题,您实际上可以从传统的 ML 模型(随机森林、lightGBM 或任何此类性质)开始。我建议您专注于您的功能。例如,您提到了 Pressure、MototSpeed。回顾过去的某个时间窗口。在同一窗口 st.dev 中计算移动平均值、最小值/最大值。要解决这个问题,您需要拥有一组健康的功能。看一下 featuretools 包。您可以使用它或了解可以使用时间序列数据创建哪些功能。回到你的问题。1)能够做到这一点的最佳模型是什么?如上所述的传统 ML 方法。您也可以使用深度学习模型,但我会首先从简单模型开始。另外,如果你没有大量数据,我可能不会接触 RNN 模型。2)处理不平衡数据的解决方案是什么?您可能希望对数据进行过度采样或欠采样。对于过采样,请查看 SMOTE 包。祝你好运
随时随地看视频慕课网APP

相关分类

Python
我要回答