带有分类变量的 statsmodels 中的聚类标准错误 (Python)

首页课程实战体系课手记专栏慕课教程

我想在使用分类变量和聚类标准误差的 statsmodels 中运行回归。

我有一个包含机构、治疗、年份和入学列的数据集。治疗是一个哑元，机构是一个字符串，其他的是数字。我确保删除任何空值。

df.dropna()

reg_model = smf.ols("enroll ~ treatment + C(year) + C(institution)", df)

.fit(cov_type='cluster', cov_kwds={'groups': df['institution']})

我得到以下信息：

ValueError：权重和列表的长度不同。

有没有办法解决这个问题，所以我的标准错误集群？

森栏

浏览 625回答 1

随时随地看视频慕课网APP