我使用多种算法训练了一个模型,包括来自skicit-learn 的随机森林和LightGBM。这些模型在准确性和其他统计数据方面表现相似。
问题在于这两种算法在特征重要性方面的行为不一致。我使用了默认参数,并且我知道它们使用不同的方法来计算特征重要性,但我认为高度相关的特征应该始终对模型的预测产生最大的影响。随机森林对我来说更有意义,因为高度相关的特征出现在顶部,而 LightGBM 则不然。
有没有办法解释这种行为,并且 LightGBM 的结果是否值得信赖?
随机森林特征重要性
LightGBM 特征重要性
与目标的相关性
蛊毒传说
小唯快跑啊
相关分类