机器学习分类

1 机器学习基本分类

基于学科的分类

  • 统计学方法:收集、分析、统计数据。描述数据的集中和离散程度,模型化数据资料。
  • 人工智能:一种积极地学习方法,利用已有的线程的数据对问题进行计算。从而提高机器本身计算和解决问题的能力
  • 信息论:信息的度量和熵的度量。
  • 控制理论:对象之间的联系和通信。

基于学习模式的分类

  • 归纳学习:通过实例数据和结果分析,使得机器能够归纳获得该数据的一种一半模型,从而对更多未知的数据进行预测。
  • 解释学习:根据已有的数据对一半的模型进行解释,从而获得一个较为泛型的学习模型。
  • 反馈学习:通过学习已有的数据,根据不断获取数据的反馈进行模型的更新。从而直接获得一个新的,可以对已有数据进行归纳总结的机器学习方法。

基于应用领域的分类

  • 专家系统:通过数据学习,获得某个方面的经验和认识能力。
  • 数据挖掘:通过对既有知识和数据的学习,挖掘出隐藏在数据之中的行为模式和类型。
  • 图形识别:通过学习已有的数据,从而获得对不同的图像或同一类图像中特定目标的认识。
  • 人工智能:对已有的模式的认识和学习。
  • 自然语言处理:实现人与对象之间通过某种语言进行有效通信。
  • 模式识别,计算机视觉,语音识别。

机器学习是一种技术,能够在很多领域应用,完成很多事情。 机器学习这门技术有很多实现方法(算法)

2 机器学习的基本算法

算法流程

  • 输入数据
  • 特征提取
  • 模型设计
  • 数据预测

基本算法分类

  • 无监督学习:黑盒训练、输入数据无区别标识、分析过程无指导、结果不可控。
  • 有监督学习:输入数据被分类标记识别。
  • 半监督学习:混合有标识数据和无标识数据。
  • 强化学习:输入不同的数据,使用已有的数据模型。

机器学习包括深度学习算法,深度神经网络是一种深度学习算法,但神经网络与机器学习没有直接从属关系。

具体算法

  • 构造间隔理论分布:聚类分析和模式识别:人工神经网络 决策树 感知器 支持向量机 集成学习AdaBoost 降维与度量学习 聚类 贝叶斯分类器
  • 构造条件概率:回归分析和统计分类:高斯过程回归 线性判别分析(线性回归) 最近邻居法 径向基函数核
  • 通过再生模型构造概率密度函数:最大期望算法
  • 概率图模型:包括贝叶斯网和Markov随机场,Generative Topographic Mapping
  • 近似推断技术:马尔可夫链 蒙特卡罗方法 变分法

    不要过度理解一个名词。机器学习,能够通过数据集,修改自身的算法模型。达到某种要求,本质上是一种函数逼近。