继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

深度学习的初级入门指导

九州编程
关注TA
已关注
手记 475
粉丝 42
获赞 203

人工智能(AI)和机器学习(ML)是目前最热门的话题。

“人工智能”这个词几乎每天都能在各处见到。你会听到优秀的开发者说他们想学习人工智能。你也会听到管理人员说他们想在他们的服务中实现人工智能。但很多时候,这些人不明白什么是人工智能。 读完这篇文章后,您将了解人工智能(AI)和机器学习(ML)的基础知识,更重要的是,您将了解最流行的机器学习类型深度学习的工作原理。(本指南面向所有人,因此不涉及高等数学)

背景

理解深度学习的第一步是理解一些专业名词之间的区别

人工智能vs机器学习

人工智能是人类智能在计算机中的复制。 当人工智能研究刚开始时,研究人员试图为特定的任务复制人类的智能——比如玩游戏。 他们引入了大量计算机需要遵守的规则。计算机有一个可能的行动的具体清单,并根据这些规则作出决定。

机器学习是指机器使用大数据集而不是硬编码规则进行学习的能力。 机器学习允许计算机自己学习。这种类型的学习利用了现代计算机的处理能力,可以很容易地处理大型数据集。

监督学习vs非监督学习

监督学习是从标记的训练数据输入和符合预期的输出。当你使用监督学习训练人工智能时,你给它一个输入,并告诉它预期的输出。如果人工智能产生的输出错误,它将重新调整其计算。这个过程在数据集上迭代完成,直到人工智能不再出错。 一个有监督学习的例子是天气预报人工智能。它学会用历史数据预测天气。该培训数据具有输入(压力、湿度、风速)和输出(温度)。

无监督学习是使用没有特定结构的数据集进行机器学习的任务。当你使用无监督学习训练人工智能时,你需要让人工智能对数据进行逻辑分类。 无监督学习的一个例子是电子商务网站的行为预测人工智能。它不会通过使用带有标签的输入和输出数据集来学习。相反,它将创建自己的输入数据分类。它会告诉你哪类用户最有可能购买不同的产品。 ​

那么,深度学习是如何工作的呢?

你现在已经准备好理解什么是深度学习,以及它是如何工作的。 深度学习是一种机器学习方法。它允许我们训练人工智能预测输出,给定一组输入。有监督学习和无监督学习都可以用来训练人工智能。 ​

我们将通过构建一个假设的机票价格估算服务来了解深度学习的工作原理。我们将使用监督学习方法对其进行训练。 我们希望我们的机票价格估算员使用以下输入来预测价格(我们不包括为简单起见的返程票):

  • 始发机场
  • 目的地机场
  • 离港时间
  • 航空公司

神经网络

让我们看看人工智能的大脑内部。 像动物一样,我们的估计员AI的大脑也有神经元。它们由圆表示。这些神经元是相互联系的。

神经元被分成三种不同的层:

  • 输入层
  • 隐藏层
  • 输出层

输入层接收输入数据。在我们的例子中,输入层有四个神经元:始发机场、目的地机场、离港时间和航空公司。输入层将输入传递到第一个隐藏层。 隐藏层对我们的输入进行数学计算。创建神经网络的挑战之一是确定隐藏层的数量,以及每层的神经元数量。深度学习中的“深”是指有多个隐藏层。 输出层返回输出数据。在我们的例子中,它给出了价格预测。

那么它是如何计算价格预测的呢?这就是深度学习的魔力开始的地方。 神经元之间的每一个连接都与一个权重有关。这个权重决定了输入值的重要性。初始权重是随机设置的。 在预测机票价格时,出发日期是一个重要因素。因此,出发日期将有很大的分量。

每个神经元都有激活功能。没有数学推理,这些函数很难理解。简单地说,它的目的之一是“标准化”神经元的输出。一旦一组输入数据通过了神经网络的所有层,它就通过输出层返回输出数据。没什么复杂的,对吧?

训练神经网络

训练人工智能是深度学习中最难的部分

  1. 你需要一个大数据集。
  2. 你需要大量的计算能力。

对于我们的机票价格估计人员,我们需要找到机票价格的历史数据。由于可能有大量的机场和起飞日期组合,我们需要一个非常大的机票价格清单。 为了训练人工智能,我们需要给它数据集的输入,并将其输出与数据集的输出进行比较。由于人工智能还没有经过训练,它的输出将是错误的。 ​

一旦我们遍历了整个数据集,我们就可以创建一个函数,向我们展示人工智能的输出与实际输出之间的错误。这个函数叫做成本函数。 理想情况下,我们希望成本函数为零。也就是说,我们的人工智能的输出和数据集的输出是一样的。 ​

如何降低成本函数?

我们改变神经元之间的权重。我们可以随机改变它们,直到我们的成本函数很低,但这不是很有效。 相反,我们将使用一种称为梯度下降的技术。 ​

梯度下降可以使我们能够找到一个函数的最小值。在我们的例子中,我们寻找的是成本函数的最小值。 它的工作原理是在每次数据集迭代后以小增量更改权重。通过计算成本函数在某一权重下的导数(或梯度),我们可以看到最小值在哪个方向。

为了最小化代价函数,您需要多次遍历数据集。这就是为什么你需要大量的计算能力。 使用梯度下降更新权重是自动完成的。这就是深度学习的魔力! 一旦我们训练了机票价格人工智能,我们就可以用它来预测未来的价格。

总而言之…

  • 深度学习使用神经网络来模仿动物的智力。

  • 神经网络中有三种类型的神经元层:输入层、隐藏层和输出层。

  • 神经元之间的联系与一个权重有关,它决定了输入值的重要性。

  • 神经元对数据应用一个激活函数来“标准化”神经元的输出。

  • 为了训练神经网络,你需要一个大的数据集。

  • 迭代数据集并比较输出将产生一个成本函数,用来说明AI与实际输出的偏差。

  • 每次迭代完成后,利用梯度下降法调整神经元之间的权值,以降低代价函数。

作者:设计稿智能生成代码

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP