机器学习偏差与方差
每个数据的观测值减去它们的均值
过拟合,则增加模型的不确定性,由于想将所有的数据都拟合到,故一点微小的变化都会产生很大的波动
增加训练数据,降低维数
无法泛化,应增加拟合项
模型复杂度太低,无法训练好数据
改进:加特征,
统计学的应用
统计学的分类
数据描述的数值方法
案例分析
机器学习中偏差与方差
统计学分类:1、描述性,2、推断性统计学
1、通过图像,反映出普遍的规律
2、根据样本数量,推断出该数据的概率
峰度示例图
峰度(Kurtosis)
偏态示例图
偏态(skewness)
公式中 s-标准差
与n相关的项是为了无偏估计
峰度的分布形态
峰度kurtosis
偏差的分布
偏态skewness
极差=最大值-最小值
方差Variance:描述一组数据离散程度的度量。
离散程度指标
偏差和方差的平衡点
对算法的期望泛化误差分解
偏差与噪声
泛化误差,以回归任务为例
偏差与方差