我正在与一家公司合作开发用于预测性维护的 ML 模型。我们拥有的数据是日志文件的集合。在每个日志文件中,我们都有来自传感器(温度、压力、MototSpeed 等)的时间序列和我们记录发生的故障的变量。此处的目的是构建一个模型,该模型将使用日志文件作为其输入(时间序列)并预测是否会出现故障。为此,我有一些问题:1)能够做到这一点的最佳模型是什么?2)处理不平衡数据的解决方案是什么?事实上,对于某种故障,我们没有足够的数据。在将时间序列转换为固定长度的子时间序列后,我尝试使用 LSTM 构建一个 RNN 分类器。如果有故障,则目标为 1,否则为 0。与零的数量相比,1 的数量可以忽略不计。结果,模型总是预测为0。解决办法是什么?
慕少森
相关分类