加入收藏 | 设为首页 | 会员中心 | 我要投稿 开发网_开封站长网 (http://www.0378zz.com/)- 科技、AI行业应用、媒体智能、低代码、办公协同!
当前位置: 首页 > 大数据 > 正文

机器学习的技巧及应用领域

发布时间:2022-06-26 17:14:29 所属栏目:大数据 来源:互联网
导读:机器学习(machinelearning)是一门多领域交叉学科,涉及了概率论、统计学、算法复杂度等多门学科。专门研究计算机怎样模拟或实现人的学习行为,它能够发现和挖掘数据所包含的潜在价值。机器学习已经成为了人工智能的一个分支,通过自学习算法,发现和挖掘数
  机器学习(machinelearning)是一门多领域交叉学科,涉及了概率论、统计学、算法复杂度等多门学科。专门研究计算机怎样模拟或实现人的学习行为,它能够发现和挖掘数据所包含的潜在价值。机器学习已经成为了人工智能的一个分支,通过自学习算法,发现和挖掘数据潜在的规律,从而对未知的数据进行预测。机器学习已经广泛的运用在了,计算机科学研究、自然语言处理、机器视觉、语音、游戏等。机器学习的方法主要分为三种,监督学习(supervisedlearging)、无监督学习(unsupervisedlearning)、强化学习(reinforcementlearning),下面将介绍这三种方法的本质区别以及它们的应用领域。
 
  一、监督学习
 
 
  
 
  训练过程
 
  上图展示了监督学习训练模型的过程,在监督学习中的训练数据是带类标的。监督学习通过使用有类标的训练数据构建模型,我们可以通过训练得到的模型对未知的数据进行预测。比如,在对手写数字识别所使用的机器学习算法就属于监督学习,在训练模型之前,我们需要先定义那张图片表示的是数字几,以便计算机从数据中提取特征更好的像类标靠近。监督学习可以被分为分类和回归,像上面手写数字的识别就属于监督学习中的分类,像房间的预测就属于回归。
 
  1、分类
 
  分类是基于对于已知数据(带类标)的学习,实现对新样本类标的预测。类标是离散的、无序的值。像对于垃圾邮件的分类就属于二分类,其中五角星表示非垃圾邮件而原表示垃圾邮件,而我们所需要训练的模型就是图中的直线,能够将垃圾邮件和分垃圾邮件进行区分。我们可以将横轴和纵轴理解为对于区分邮件的两个特征,可以发现这些数据都是离散的。上面所提到的手写数字的识别属于多分类。
 
  
 
  分类
 
  2、回归
 
  回归是针对连续型输出变量进行预测,我们通过从大量的数据中寻找自变量(输入)和相应连续的因变量(输出)之间的关系,通过学习这种关系来对未知的数据进行预测。如下图,通过自变量和因变量来拟合一条直线,使得训练数据与拟合直线之间的距离最短,最常用的距离是采用平均平方距离。通过对训练数据的分析我们可以获取到这条直线的斜率和截距,从而可以对于未知数据进行预测。
 
  
 
  回归
 
  二、强化学习
 
  强化学习是通过构建一个系统(agent),在与环境(environment)交互的过程中提高系统的性能。环境的当前状态信息会包括一个反馈信号,我们可以通过这个反馈信号对当前的系统进行评价改善系统。通过与环境的交互,agent可以通过强化学习来得到一系列行为,通过对激励系统的设计使得正向反馈最大。强化学习经常被使用在游戏领域,比如围棋比赛,系统会根据当前棋盘上的局态来决定下一步的位置,通过游戏结束时的胜负来作为激励信号。
 
 

(编辑:开发网_开封站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读