如果正确的利用模式识别进行商业预测和决策,那么会为企业带来巨大的利益。机器学习(ML)研究这些模式,并将人类决策过程编码成算法。这些算法可以被应用到几个实例以得出有意义的结论。在这篇文章中,我们将了解一些机器学习的基础、工作原理及特点。
举例来了解机器学习
经研究预测,截至到2020年,企业采用机器学习、人工智能和深度学习、物联网(IOT)以及大数据将从他们那些不太知情的同行那里带走超过1兆2000亿美元。
数据是机器学习的关键。算法从一定数量的数据中学习,然后应用这种学习来做出明智的决策。Netflix有一个很好的关于下一个你想看的节目的想法,Facebook可以在照片中识别你和你的朋友,这要感谢机器学习.。
机器学习是关于自动执行任务的,它的应用跨越了广泛的行业领域。数据安全公司可以使用机器学习来追踪恶意软件,而金融公司可以使用它来增强其盈利能力这里有个例子,让我们考虑一个手电筒,无论什么时候,当“黑暗”一词出现在一个短语中的时候,它就会被程序打开。我们将使用的几个短语作为关于手电筒的机器学习算法的输入数据。
用程序语言来表达机器学习
为了解决业务的复杂性,并带来机器学习的技术创新,编程语言和框架技术不断地被引入和更新。一些编程语言来来往往,而一些被相关的、保留的还在经历着考验。这两个编程语言在机器学习和人工智能的圈子里是最强大的。还有其他语言如java、C++、Julia、SAS、MATLAB、Scala,还有很多。然而,我们讨论的仅限于Python和R这两个语言.
Python不仅流行,还很简单,并且功能众多。它是一种能在所有主流平台上使用的便携式编程语言,如Linux、Windows、MAC和UNIX。Python不仅作为Web应用开发的通用语言,而且还可以作为科学计算、数据挖掘和分析的专用语言。如果有一种在招聘人员中最喜欢的机器学习和AI的编程技术,那就肯定是Python了。
R语言是适用于机器学习的另一种编程语言,并且它与统计学家和数学家有着密切的联系。现在,虽然机器学习本身与统计学的原理密切相关,但是R作为机器学习语言可以带来巨大的好处。如果你希望在大数据中解决模式问题,R语言是最佳选择,它是由统计学家和科学家设计的,很方便地用于数据分析。
机器学习算法的工作原理
机器学习算法评估一个用一种特殊的数据来泛化的预测模型。因此,必须有大量的实例,以供机器学习算法用来理解系统的行为。现在,当机器学习算法与新类型的数据一起出现时,系统将能够生成类似的预测。了解机器学习算法的不同组成部分和它们之间的相互关系,可以使机器学习任务变得更加容易。
机器学习算法有一个结构化的学习组件,使他们有能力理解输入数据中的模式,从而导致输出。
输入数据 -> 模式 -> 机器学习算法 -> 推断/输出
这里让"Y"表示未来的预测结果,让"X"表示输入的实例.那么,我们得出这个表达式:
Y=f (X)
其中“Y”也称为映射函数,“f”称为目标函数。“f”总是未知的,因为它在数学上是无法确定的。因此,机器学习被用来获得目标函数的近似值,“f”。机器学习算法考虑到关于目标函数的几个假设,并用一个带有评估的假设来开始。为了得到输出的最佳估值,进行了大量的假设迭代。正是这种假设使得机器学习算法能够在短时间内得到一个更好地逼近目标函数的近似值。