《统计学习方法》读书笔记（第一章）-原创手记-慕课网

记录和总结自己读书的一些心得与体会。

第一章主要介绍一些基本概念与思想，回答了几个基本问题。

一些基本概念：

输入空间，输出空间，特征空间，输入空间和输出空间分别是X和Y所有可能取值的集合，输入由特征向量表示，所有特征向量的空间称为特征空间。输入空间与特征空间可以相同，也可以不同。

损失函数针对单一样本，风险函数针对损失期望，经验风险指模型在训练数据集上的平均损失，期望风险指模型在整个数据上的损失期望。

1. 统计学习是什么？

统计学习是一门数据驱动的学科，又称为统计机器学习。它由监督学习、非监督学习、半监督学习和强化学习组成。目的是对数据进行预测与分析，特别是未知数据。

2.如何构建一种统计学习方法？

统计学习方法三要素：模型，假设空间（例如某个函数集合）；策略，评估模型的方法（例如平方损失、对数损失等）；算法，学习模型的方法（最优模型求解），构建一种统计学习方法就是确定具体的统计学习三要素。

3.统计学习为什么有效？在有限的训练数据集上所得出的模型为什么可以用到未知的测试数据上？

首先有一个基本假设，输入和输出的随机变量X和Y服从P(X,Y)分布，训练数据和测试数据都是依联合概率分布P(X,Y)独立同分布产生的。

webp

期望风险

webp

经验风险

由大数定律可以得知，当N趋近于无穷大时，经验风险趋近于期望风险，可以用经验风险估计期望风险。

4. 经验风险与结构风险分别是什么？

当样本容量较小时，采用经验风险最优化的学习方式可能导致“过拟合”现象的发生，泛化能力较差，结构风险（如下图）在经验风险的基础上添加了模型复杂度作为惩罚项，监督学习问题转化为经验风险或结构风险的最优化问题。λ作为一个权衡经验风向与模型复杂度的系数。模型复杂度又称为正则化项，常用的有L1范数和L2范数。

webp