我被要求使用以下步骤编写逻辑回归程序。
从 MASS 包中加载 R 数据集活检。
将数据捕获为 pandas 数据框。
将列名类重命名为 Class。
将类别列值良性和恶性分别转换为“0”和“1”。
建立一个自变量 V1 和因变量 Class 的逻辑回归模型。
用数据拟合模型,并显示伪 R 平方值
我已经尝试更改值,但我不确定该怎么做。另外,我是使用 Python 进行统计的初学者。
import statsmodels.api as sa
import statsmodels.formula.api as sfa
biopsy = sa.datasets.get_rdataset("biopsy","MASS")
biopsy_data = biopsy.data
biopsy_data.rename(columns={"class":"Class"})
biopsy_data.Class = biopsy_data.Class.map({"benign":0,"malignant":1})
log_mod1 = sfa.logit("V1~Class",biopsy_data)
log_res1 = log_mod1.fit()
print(log_res1.summary())
我希望有一个值表,但输出是
ValueError("endog must be in the unit interval.")
宝慕林4294392
LEATH
相关分类