机器学习
无监督 不打标签 聚类
监督 打标签 分类 回归
决策树,通过不同的条件,来判断一个问题如果处理
条件的选取有不同的算法,一种是观察信息熵的变化,来决定
概率*log概率
离散->分类
连续->回归
机器学习:通过“学习”的过程不断提高性能
sklearn(scikit-learn)主要用于数据挖掘与机器学习
机器学习:由数据经过一个过程获得结果,本质是一个函数
机器学习监督学习与无监督学习。机器学习的本质是一个函数。机器学习使用训练好的算法或者函数对历史数据进行处理,得出我们想要的结果。根据结果的不同,我们把机器学习分成以下几类
如果不在打标记的情况下得出的结果我们称之为无监督学习,如聚类和关联规则
如果提前进行打标记处理,那么就是监督学习。根据打标记的数据是离散的还是连续的,我们又进一步分为分类(结果是有限、离散的)和回归(结果是连续的)。数据挖掘和机器学习的一般步骤是数据预处理数据建模结果验证,这个工具包具体要结合自己的论文和实习进行整理。
理论基础:


scikit-learn 决策树:监督学习 树形结构