我想知道如何计算sklearn中LogisticRegressionCV的最终模型(即决策边界)。所以说我有一些Xdata和ylabel这样
Xdata # shape of this is (n_samples,n_features)
ylabels # shape of this is (n_samples,), and it is binary
现在我跑
from sklearn.linear_model import LogisticRegressionCV
clf = LogisticRegressionCV(Cs=[1.0],cv=5)
clf.fit(Xdata,ylabels)
这只是在CV中查看一个正则化参数和5倍。因此,clf.scores_将是一个具有一个键的字典,该键的值是形状为(n_folds,1)的数组。通过这五折,您可以更好地了解模型的性能。
但是,我对您从中获得的信息感到困惑clf.coef_(并且我假设中的参数clf.coef_是在中使用的参数clf.predict)。我认为有几种选择:
输入的参数clf.coef_
来自在所有数据上训练模型
的参数clf.coef_
来自最佳得分
中的参数以clf.coef_
某种方式在折痕处平均。
我以为这是一个重复的问题,但是对于我自己而言,我无法在sklearn文档或LogisticRegressionCV的源代码中找到简单的在线答案。
慕勒3428872
相关分类