课程名称:Python3入门机器学习 经典算法与应用 入行人工智能
课程章节: 1-1,1-2,1-3;2-1,2-2,2-3,2-4
主讲老师:liuyubobobo#
### 课程内容:
今天学习的内容包括:
- 机器学习的概念
- 数据基础概念
- 机器学习基本任务
- 算法分类
1.机器学习的概念
试图对比着,从人类的学习中理解,机器学习。
人类学习(经验学习)以猫狗识别为例:
1.从一定的样本资料。(从大人指给你看,这只是猫这只是狗)
2.经过大脑的学习,归纳,整理,总结(观察特征并分析总结记住)
3.到形成自己的知识,和经验。(明白了,这样的是狗,这样的是猫)
4.再遇到类似的问题,从而使大脑在遇到类似的问题,能快速做出反应。
机器学习
1.大量的学习资料(猫狗照片)
2.通过算法建立模型
3.输入新资料,判断,输出结果
### 总结: >人类学习和机器学习,总体上一样。
人类学习,
只需要少量样本资料(例如几只猫和几只狗的照片),就能非常准确识别。
但是判断的效率比较低
机器学习
需要大量样本才能准确识别。
判断效率快,能快速处理大量新样本
2.数据基础概念
-
数据整体——数据集(data set)
-
每一行数据——一个样本(sample)
-
每一列数据——一个特征(feature)
以左上角为坐标系,向下为x轴(i,列,特征索引),向右为y轴(j,行,数据索引)
X为矩阵(通常矩阵为大写)
y为向量(向量为小写,约定俗成)
3.机器学习基本任务(分类任务/回归任务)
分类任务(离散值)
-
二分类
1.判断猫或狗,判断1或0 2.判断是不是垃圾邮件 3.判断有没有肿瘤
-
多分类
1.数字识别 2.图像识别 3.人脸识别 4.判断患肿瘤的大小
回归任务(连续值)
1.房屋价格
2.股票价格预测
3.销售额预测
算法分类
监督学习;非监督学习;半监督学习;批量学习;在线学习
监督学习
我们给算法一个数据集,从标记的训练数据来推断一个功能的机器学习任务。
非监督学习
在无监督学习中数据无任何标签,或相同标签的数据,交给机器来识别其中的结构,可以将数据进行分类。(聚类分析)
对数据进行降维处理(压缩特征,删除特征)
异常检测(分类之后,有几个点不合群)
半监督学习
一部分数据有标记或者答案,另一部分数据没有
通常先使用无监督对数据进行预处理,分类,然后使用监督学习进行预测
批量学习(简单)
(在数据,环境变化不那么快的时候使用,定期进行批量学习来适应环境)
收集学习资料,
通过算法创建模型(模型不变)
模型投入使用
在线学习(复杂)
(新的数据有可能不是正常的数据,或者不合适的数据,判断异常数据进行加强监控)
收集学习资料,
通过算法创建模型(模型优化)
模型投入使用
通过预测值与实际值来改进模型
总结:
人工智能>>机器学习算法>>深度学习
-
机器学习算法只是人工智能领域中解决问题的一种方法。
-
人工智能还包含搜索算法,等等其他算法
-
事实上,机器算法中某些底层算法(如梯度下降)就属于搜索算法
-
请多多涉略不同内容,切勿孤立地学习
-
机器学习比起人脑需要更大量的数据来进行学习,但是学习之后进行判断的效率很高,近年来机器学习,深度学习的兴起,我想离不开可以大量获取的数据,和计算机算力的提升,
-
关于机器学习,我认为是从大量数据集中学习经验,来解决某一个任务,并通过一种衡量其准确与否的度量,来测量计算机在任务中的表现,然后提高经验,从而更好地用准确的经验来完成任务
-
今天第一次学习,学习了2小时,是在看完吴恩达教授的教学视屏之后,机器学习的第二站,希望也能收获满满