强制随机森林分类器使用所有输入要素?

为了执行二进制预测,我有5个特征,我想将其用于我的随机森林分类器,其中两个根本没有被利用。我知道这是机器学习的全部意义,只选择有用的特征,但其他三个特征可能有偏见的数据,我想确保我的所有特征都以相同的权重使用来运行我的分类器。我找不到这个问题的直接答案。我用在这项工作。任何意见/建议将不胜感激。sklearnpython



神不在的星期二
浏览 111回答 2
2回答

幕布斯6054654

您可以通过设置 来请求随机森林分类器中每个分割中正在考虑的所有特征。max_features = None从文档中:max_features:整型、浮点型、字符串或无,可选(默认为“自动”)寻找最佳拆分时要考虑的功能数量:如果为 int,则在每次分割时考虑特征。max_features如果是浮点数,则为分数,并且在每次拆分时都会考虑特征。max_featuresint(max_features * n_features)如果“自动”,则 .max_features=sqrt(n_features)如果为“sqrt”,则(与“自动”相同)。max_features=sqrt(n_features)如果为“log2”,则 .max_features=log2(n_features)如果为“无”,则 .max_features=n_features为什么使用单个树的随机森林比决策树分类器好得多?中的答案可能有助于解释和提供一些上下文。

牧羊人nacy

它可以帮助你的是设置参数max_feature = 1,因此每个节点将采用(均匀分布)随机特征,并且将强制使用它。但是,您还需要设置树的深度,因为它将无限地添加点头,直到接收到主要特征之一。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python