带有分类变量的 statsmodels 中的聚类标准错误 (Python)

我想在使用分类变量和聚类标准误差的 statsmodels 中运行回归。


我有一个包含机构、治疗、年份和入学列的数据集。治疗是一个哑元,机构是一个字符串,其他的是数字。我确保删除任何空值。


df.dropna()    

reg_model = smf.ols("enroll ~ treatment + C(year) + C(institution)", df)

.fit(cov_type='cluster', cov_kwds={'groups': df['institution']})

我得到以下信息:


ValueError:权重和列表的长度不同。


有没有办法解决这个问题,所以我的标准错误集群?


森栏
浏览 503回答 1
1回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python