我正在使用随机森林进行特征选择(拳头100个最重要的特征)。
这是我正在使用的代码;
RandomForest_model = RandomForestRegressor(n_estimators=300,n_jobs=-1)
RandomForest_model.fit(train_x,train_y)
RandomForest_model.score(train_x,train_y)
indices = RandomForest_model.feature_importances_.argsort()[:100]
train_100_x= train.iloc[:,indices]
test_100_y = test_100_y.iloc[:,indices]
我的问题是火车和测试列不匹配。
看图片:
培训和测试中第一列的图片:
我是在做错事还是做事更有效?
开满天机
相关分类