当前位置: 首页 > news >正文

什么是机器学习?

一、概念(维基百科)

        机器学习是人工智能的一个分支。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论

二、主要特点

        机器学习的主要特点包括:

        1、数据驱动:机器学习模型的性能主要依赖于输入的数据。数据的质量和数量直接影响模型的准确性和泛化能力,所谓“Garbage in, garbage out”。

        2、模式识别:机器学习算法能够识别数据中的模式,这些模式可以是显式的(如分类标签)或隐式的(如特征之间的关系)。

        3、自动化:机器学习减少了人工/手工解决问题的需要,使计算机能够自动从数据中学习和改进,从而在生活中替代人工操作,提升效能。

        4、适应性:机器学习模型可以适应新的数据(即泛化能力),这也是其能够广泛应用于业务实践中的重要原因。

三、机器学习的主要分支

        1、监督学习:有监督的机器学习指的是模型从标记的训练数据中学习,并尝试预测未见过数据的标签(即训练数据是有标签的)。

        2、无监督学习:模型在没有标签的数据上进行训练,试图发现数据中的结构和模式。比如聚类学习,模型不需要关注数据是否有标签,仅仅通过特定的指标(如余弦相似度等)对样本进行类别聚合。

        3、半监督学习:半监督学习结合少量标记数据和大量未标记数据进行学习,涉及多种算法,包括自训练(Self-training)、标签传播(Label Propagation)、伪标签(Pseudo-Labeling)、一致性正则化(Consistency Regularization)等。

        4、强化学习:模型通过与环境的交互来学习,目标是最大化某种累积奖励。

        5、深度学习:一种特殊的机器学习方法,使用多层神经网络来学习数据的复杂模式。

四、机器学习与深度学习

        深度学习虽然从概念上是机器学习的子集,但笔者感觉深度学习在某些场合已经与机器学习有一定的界限了。比如在实际工作中,我们说用了一些机器学习模型,对方想到的基本都是逻辑回归、决策树、支持向量机等模型,却并不会想到CNN、LSTM这样的神经网络(对于这些模型,我们会说用了神经网络/深度学习模型)。因此,还是有必要对机器学习和深度学习做一个简单的对比:

        1、特征工程

                (1)机器学习:对数据质量要求高,往往需要大量的特征工程选出有效特征;

                (2)深度学习:特征工程显得不那么重要,部分场景下可以直接对数据建模;

        2、模型复杂度

                (1)机器学习:模型复杂度较低,参数较少,可解释性强;

                (2)深度学习:参数量较大,模型的决策过程存在“黑匣子”问题,可解释性较差;

        3、计算资源

                (1)机器学习:计算资源需求低,消费级cpu即可,推理速度快;

                (2)深度学习:计算资源要求高,部分模型需要GPU加速运算,推理速度相对较慢;

五、总结

        不论是机器学习模型还是深度学习模型都各有其优劣,我们很难说深度学习模型一定比机器学习模型要好,在实际工作中我们也不会一上来就用神经网络。具体问题还是要具体分析,很多时候我们会同时进行机器学习和深度学习的建模,比较更优者进行后续的优化和部署。有时候,对于标签量小、特征数少、特征取值有限的数据,机器学习模型表现远优于深度学习,果然你大爷还是你大爷!

相关文章:

  • 谷神后端$vs.proc.invoke.stock.loadMap
  • ngxin
  • FileLink跨网文件传输 | 一站式跨网文件交换平台,重塑企业信息流通生态!
  • mysql数据库的基本管理
  • ansible实用模块
  • LLM基础概念:Prompt
  • Desmos图形计算器分段函数
  • SpringBoot日志详解
  • 传输大咖47 | 软件企业文件传输难题?这款FTP替代工具了解一下
  • python/爬虫技术/lxml工具介绍/XML和HTML解析
  • LVS-DR实战案例,实现四层负载均衡
  • TomCat乱码问题
  • EasyAR自定义相机RTSP视频流(CustomCamera)
  • 【UR #1】外星人(dp思维技巧)
  • Java项目: 基于SpringBoot+mybatis+maven+vue图书进销存管理系统分前后台(含源码+数据库+毕业论文)
  • 「前端早读君006」移动开发必备:那些玩转H5的小技巧
  • 【跃迁之路】【519天】程序员高效学习方法论探索系列(实验阶段276-2018.07.09)...
  • javascript面向对象之创建对象
  • mysql_config not found
  • Promise初体验
  • -- 查询加强-- 使用如何where子句进行筛选,% _ like的使用
  • 当SetTimeout遇到了字符串
  • 反思总结然后整装待发
  • 工程优化暨babel升级小记
  • 关于使用markdown的方法(引自CSDN教程)
  • 湖南卫视:中国白领因网络偷菜成当代最寂寞的人?
  • 记一次和乔布斯合作最难忘的经历
  • 我看到的前端
  • 一道面试题引发的“血案”
  • 一份游戏开发学习路线
  • nb
  • 白色的风信子
  • 正则表达式-基础知识Review
  • ​二进制运算符:(与运算)、|(或运算)、~(取反运算)、^(异或运算)、位移运算符​
  • ​用户画像从0到100的构建思路
  • #面试系列-腾讯后端一面
  • $var=htmlencode(“‘);alert(‘2“); 的个人理解
  • (02)Hive SQL编译成MapReduce任务的过程
  • (1)(1.19) TeraRanger One/EVO测距仪
  • (ZT)出版业改革:该死的死,该生的生
  • (二)十分简易快速 自己训练样本 opencv级联lbp分类器 车牌识别
  • (算法)Game
  • (一)RocketMQ初步认识
  • (转载)利用webkit抓取动态网页和链接
  • ******之网络***——物理***
  • ***汇编语言 实验16 编写包含多个功能子程序的中断例程
  • ***检测工具之RKHunter AIDE
  • .Net core 6.0 升8.0
  • .NET Project Open Day(2011.11.13)
  • .NET 程序如何获取图片的宽高(框架自带多种方法的不同性能)
  • .NET 动态调用WebService + WSE + UsernameToken
  • .NET的数据绑定
  • .NET国产化改造探索(一)、VMware安装银河麒麟
  • .NET精简框架的“无法找到资源程序集”异常释疑
  • .NET面试题(二)