我想在使用分类变量和聚类标准误差的 statsmodels 中运行回归。
我有一个包含机构、治疗、年份和入学列的数据集。治疗是一个哑元,机构是一个字符串,其他的是数字。我确保删除任何空值。
df.dropna()
reg_model = smf.ols("enroll ~ treatment + C(year) + C(institution)", df)
.fit(cov_type='cluster', cov_kwds={'groups': df['institution']})
我得到以下信息:
ValueError:权重和列表的长度不同。
有没有办法解决这个问题,所以我的标准错误集群?
相关分类