RT.
1. 决策树算法(C4.5, CART)
无监督学习:实际上,决策树通常用于有监督学习,因为它依赖于标注数据进行训练。可以根据特征来划分数据,进行分类或回归。
C4.5和CART:虽然这两者在过去很常见,但如今更先进的算法(如XGBoost)已取代它们。可以考虑添加对这些新算法的简要介绍。
2. K-Means(无监督学习)
聚类算法非常适合于无监督学习。K-Means通过最小化每个点到质心的距离来分组,适用于大多数情况下数据分布较为均匀的情况。
3. SVM(支持向量机)
支持向量机是一个非常强大的分类与回归算法,尤其适用于高维数据。尽管深度学习在某些任务中已超越它,SVM仍然是经典的高效分类算法之一。
4. Apriori
已淘汰的算法,确实因其计算复杂度和多次扫描数据库的需求而受到批评。FP-Growth是更高效的替代者,它通过树形结构减少了对数据库的访问次数。
5. EM算法
作为一种统计学习方法,EM算法的理解确实有一定的门槛,适用于混合模型或缺失数据处理等问题。
6. PageRank
虽然PageRank仍然广泛应用于搜索引擎中,但其具体实现细节已经有许多创新和优化,尤其是在大规模图数据的处理上。
7. AdaBoost
这是一种集成学习方法,可以与弱分类器(如决策树)结合,通过加权的方式提高整体分类准确率。它在图像识别中有广泛应用。
8. kNN(k-近邻)
与K-Means的不同之处在于,kNN是基于距离的分类方法。它简单易懂,但对于大数据集来说计算复杂度较高。
9. Naive Bayes
适用于分类任务,特别是在文本分类中,如垃圾邮件检测。其假设特征之间相互独立,这在实际数据中可能不完全成立,但通常仍能获得不错的效果。
高级算法:
FP-Growth
在Apriori的基础上优化了计算效率,尤其适用于关联规则挖掘。
逻辑回归
非常重要且广泛使用,尤其是在二分类问题和概率预测中。
随机森林(RF)和GBDT
两者都是决策树的集成算法,广泛用于分类与回归问题。GBDT在处理非线性问题时表现尤为出色。
推荐算法
推荐系统广泛应用于电商、社交平台中,有很多优化方法,如协同过滤、内容推荐等。
LDA(潜在狄利克雷分配)
主要用于主题模型,在文本挖掘中有重要应用。
Word2Vec
用于将词语转化为向量表示,是文本数据处理中的一个重要技术。
HMM与CRF
隐马尔可夫模型与条件随机场都广泛应用于序列数据建模,如语音识别、自然语言处理。
深度学习
包括CNN、RNN等深度神经网络,是目前处理大规模复杂数据(如图像、语音、文本)最前沿的技术。
机器学习常见算法(1)ICDM
1.分类---C4.5使用决策树算法,可以解决【分类】&【回归】问题;
2.聚类---K-Means算法,属于无监督方法,解决电信用户分类问题;
3.统计学习---SVM(支持向量机)可以解决分类(主)和回归问题,有很好的表现和深厚的数学理论支撑,曾经被认为是最好的分类算法。现在光芒被【深度学习】掩盖了。有一定的数学门槛,面试中经常被问。
4.关联分析---Apriori应用于“尿片和纸尿裤”案例,最早解决了频繁项集问题。由于需要频繁访问数据库,已被淘汰。取代它的是华人开的【FP-Growth】算法。应用:电商的推荐系统,但目前有更好的替代方法。
5.统计分析---EM算法是一个算法框架,用于解决一系列问题。
6.连接挖掘---PageRank。Google使用的网页排序算法,很著名。
7.集装与推进---AdaBoosts算法,应用于人脸识别,本质为改进的决策树算法,属于有监督的分类算法。
8.分类---kNN。相对简单的分类算法,有监督。
9.分类---Naive Bayes朴素贝叶斯算法,用于识别垃圾邮件。
目前不常用的算法:Apriori和CART。
一、机器学习算法
SVM:支持向量机
关联分析: FP-Growth
AdaBoot: 有监督学习,人脸识别
二、常用算法
FP-Growth
逻辑回归
搜索结果的排序等
RF、GBDT
决策树的改进
推荐算法
各个推荐系统的算法
LDA
自然语言处理算法
Word2Vetor
文本挖掘
HMM、CRF
文本挖掘
深度学习
图像识别等
1
1
机器学习常见算法
常见机器学习算法
5-2机器学习常见算法和分类(2)
高级一点
常见算法
常見算法表
常见算法一览
常见算法列表
分类算法同时也是回归算法?
!!SVM算法
AdaBoost
Naive Bayes
机器学习常见算法:
机器学习常见算法
机器学习常见算法
机器学习常见算法一览
机器学习算法一览
机器学习算法
机器学习常见算法
现在的流行算法
机器学习常见算法一览
C4.5/CART-决策树算法(分类算法)-有监督学习
K-Means-聚类算法-无监督学习
SVM-分类算法(也可解决回归问题)
K-Means也算EM的一种
PageRank —— Google
AdaBoost —— 解决分类问题,大部分人脸识别所用算法,决策树改进版
NaiveBayes —— 垃圾邮件识别,分类算法
FP-Growth —— 华人发明
逻辑回归 —— 百度推荐排序
RF、GBDT —— 决策树算法改进,类似AdaBoost
推荐算法 —— 电商网站标配
LDA —— 文本分析
Word2Vector —— 文本挖掘
深度学习 —— 主要用于图像识别
统计学习——SVM
集装与推进——Adaboost(人脸识别)
机器学习常见算法:
决策树算法(有监督):解决分类、回归问题;C4.5、kNN(不常用)
聚类:K-Means算法(无监督)
统计学习:SVM算法
关联分析及规则:Apriori(淘汰)——需多次扫描庞大数据库
FP-Growth——仅需两次扫描数据库
链接挖掘:PageRank算法(Google)
集装与推进:AdaBoost(人脸识别)(决策树改进版,有监督学习)(本质上解决分类问题)
逻辑回归:google、百度搜索结果排
推荐算法:产品推荐等
文本分析&挖掘、自然语言处理:LDA、Word2Vector、HMM、CRF
深度学习:图像识别
常见算法一览
机器学习常见算法一览表