一、生成式模型
这个系列将讨论人工智能领域非常重要、也十分被看好的一类模型:生成式模型(generative model)。因为这类模型不但能根据特征预测结果,还能“理解”数据是如何产生的,并以此为基础“创造”数据,这才是“真正意义上”的人工智能。而且正如费曼[1]所说的“What I cannot create, I do not understand(我不能创造的东西,我就不了解)”,生成式模型在某种意义上是真正理解了数据。
生成式模型会大量用到概率这个数学工具,特别是条件概率和贝叶斯定理。这篇文章将主要讨论这些数学知识。
二、概率:量化随机
概率是量化事物随机性或者可能性的数学工具,在很多领域都有广泛的应用。但遗憾的是,概率或者随机本身是数学里人类理解最差的分支。在通常情况下,可以将概率从直观上理解为事件发生的比例。如图1所示,向图中的方形框随机投掷小球,那么小球落入圆圈的概率就等于圆圈的面积除以方形框的面积。
图1
概率对数据科学尤其重要,举两个常见的例子:在搭建模型时,带有一些随机性的模型和算法往往预测效果会好于完全确定性的模型和算法;在异常检测时,理解概率能帮助我们区分真正的异常和正常情况下的随机扰动。
本节将着重介绍数据科学中常用到的概率知识,帮助读者在之后的章节里更好地掌握与概率相关的模型。
三、定义概率:事件和概率空间
我们首先从掷骰子这个常见的例子中引出概率的定义。假设我们连续随机地掷两次骰子,并计算两次所得点数的和。记第一次掷骰子得到的点数为
对于其他结果也类似地定义它们发生的概率。
图2
将上面例子中的方法推广到一般情况,给出概率的定义[2]。
将所有不能再分的随机结果,记为
,对于所有的 都成立
对于一个事件E,对应的概率为
四、条件概率:信息的价值
上面讨论了单个事件和多个事件发生一个的概率。现在将讨论两个或多个事件同时发生的概率。假设事件
为了解答这个问题,我们定义随机事件的条件概率如公式(3)所示。其中
将公式(3)中的两个条件概率结合起来,就可以得到所谓的贝叶斯定理:
举一个简单的例子来直观地感受条件概率这个概念。假设在一个大学的班级里:
来自重庆的学生比例为10%,而这批学生中喜欢吃辣的比例为90%
剩下的来自其他地区的学生占比90%,他们当中喜欢吃辣的比例为30%
为了表述清楚,用
图3
上面的例子告诉我们,条件概率
如果条件概率等于原本的概率,即
当两个事件相互独立时,可以推出
作者:tgbaggio
链接:https://www.jianshu.com/p/ed4605d9f30a