我有一个包含 6 个输入变量(温度、压力、流速等)的大型数据集,以提供产量、纯度和转化率等输出。总共有大约 47600 个实例,这些都在 Excel 电子表格中。我已经在这些数据上应用了人工神经网络和随机森林算法,并获得了预测图和准确度指标。(在 Python 中)随机森林模型具有赋予输入变量重要性的特征。我现在想对这些数据执行 PCA 以首先与随机森林结果进行比较,并获得有关我的输入数据如何相互交互以给出我的输出的更多信息。我看过一些 youtube 视频和教程来了解 PCA,但是他们使用的数据与我的完全不同。
下面是我的数据片段。前 6 列是输入,后 3 列是输出。

如何使用 PCA 进行分析?我已经设法在 python 中绘制它,但是情节非常繁忙,几乎没有提供太多信息。
欢迎任何帮助或提示!也许是不同的分析工具?我不介意使用 Python 或 Matlab
谢谢 :)
阿波罗的战车
www说
随时随地看视频慕课网APP
相关分类