什么是机器学习:
1、利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策。
2、对不确定场景的决策的两种方法:
(1)机器学习
(2)数据分析:依赖于数据分析师,即人
从数据中寻找规律:
1、全部数据
2、量化、用模型刻画(拟合)规律
机器学习发展的原动力:
1、从历史数据中找出规律,把这些规律用到对未来自动做出决定。
2、用数据替代expert
3、经济驱动,数据变现
业务系统发展的历史:
1、基于专家经验
2、基于统计——分纬度统计
3、机器学习——在线学习
OLAP(联机分析处理):数据仓库最主要的;
典型应用自然语言处理和图像识别:
1、自然语言处理:情感分析+实体识别
* 情感分析(SA):又称为倾向性分析和意见挖掘,对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程,其中情感分析还可以分为情感极性(倾向)分析,情感程度分析,主客观分析等。
* 实体识别(NER):指识别文本中具有特定意义的实体,包括人名、地名、机构名、专有名词等。
2、图像识别——深度学习
ctr预估和协同过滤
1、互联网广告——ctr预估
* ctr:Click-through-rate,点击通过率,是衡量互联网广告效果的一项重要指标。
2、推荐系统——协同过滤
* 协同过滤:用于分辨某位特定顾客可能感兴趣的东西,这些结论来源于其他相似顾客对那些产品感兴趣的分析。
朴素贝叶斯和决策树
1、垃圾邮件
2、信用卡欺诈
关联规则:
1、购物篮分析:啤酒+尿片
聚类:
1、用户经分细准营销