分类算法
分类学习的基本概念
建立模型逻辑:
类别并非男和女,而是女和非女,因为不清楚分类总和是否全体,所以采用A和非A作为分类。
评价指标
正确率,代表在整体中识别正确的几率
精度:数据输出的正确率
召回率:输入的数据能够识别出来的正确率
F1 score 是精度和召回率的调和平均值
逻辑回归 :logistic回归(LR) 逻辑回归是一种广义的线性回归分析模型
常用于数据挖掘、疾病自动诊断、经济预测等等领域。
逻辑回归算法的优缺点
优点:思路清晰简单易实现,实现代价低
缺点:只能处理线性问题,对于非线性问题的拟合度、精度低
上图为sigmoid函数
一般来说,在二维空间的线性变换下,z = ax + b ,同理 w^T在此也是系数矩阵,系数矩阵乘以特征向量加上常量,常量b可以加到w^T矩阵里面,省略不写b
sigmoid函数的图像:
逻辑回归的模型就是每个特征的回归系数,即W^T
特征:线性分类,不进行特别处理,无法处理非线性的问题
通过训练数据集,计算出最合适的系数向量,即W^T,最合适即是指错误概率最低的情况
应用:逻辑回归是分类算法的经典算法
混淆矩阵;评价指标
评价指标公式
正确率,精度,召回率