当前位置: 首页 > news >正文

数据挖掘与数据分析(四)—— 预处理理论(1) —— 特征工程 Feature Engineering

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已

 

当你想要你的预测模型性能达到最佳时,你要做的不仅是要选取最好的算法,还要尽可能的从原始数据中获取更多的信息,为预测模型得到更好的数据。这就是特征工程要做的事,它的目的就是获取更好的训练数据。

特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。

简而言之,特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)

 

特征工程

①特征构建

      特征构建是指从原始数据中人工的找出一些具有物理意义的特征。需要花时间去观察原始数据,思考问题的潜在形式和数据结构,对数据敏感性和机器学习实战经验能帮助特征构建

②特征提取

       通过特征转换的方式得到一组具有明显物理或统计意义的特征

       如PCA主成分分析、LDA线性判别分析、ICA独立成分分析

③特征选择

      特征选择是剔除不相关或者冗余的特征,减少有效特征的个数,减少模型训练的时间,提高模型的精确度。特征提取通过特征转换实现降维,特征选择则是依靠统计学方法或者于机器学习模型本身的特征选择(排序)功能实现降维

 

 

 

 

 

相关文章:

  • representation learning 表示学习/表征学习
  • Darknet 轻量级深度学习训练框架
  • cfg文件
  • 双向循环神经网络(BiRNN)MNIST手写体识别(tensorflow)
  • 双向循环神经网络(BiRNN)
  • MIPS
  • FPGA
  • Verilog硬件描述语言
  • SLAM
  • 深度估计(Depth Estimation)
  • 视觉里程计Visual Odometry(VO)
  • LiDar 激光雷达
  • Gazebo
  • Data Mining KDD
  • Word Embedding词嵌入(word2vec)
  • 2018一半小结一波
  • Angular数据绑定机制
  • AWS实战 - 利用IAM对S3做访问控制
  • CentOS7简单部署NFS
  • ECMAScript入门(七)--Module语法
  • extjs4学习之配置
  • IndexedDB
  • Java教程_软件开发基础
  • vue总结
  • 初识 webpack
  • 二维平面内的碰撞检测【一】
  • 完善智慧办公建设,小熊U租获京东数千万元A+轮融资 ...
  • 智能情侣枕Pillow Talk,倾听彼此的心跳
  • ​软考-高级-信息系统项目管理师教程 第四版【第23章-组织通用管理-思维导图】​
  • #在线报价接单​再坚持一下 明天是真的周六.出现货 实单来谈
  • ( )的作用是将计算机中的信息传送给用户,计算机应用基础 吉大15春学期《计算机应用基础》在线作业二及答案...
  • (2)(2.4) TerraRanger Tower/Tower EVO(360度)
  • (4)(4.6) Triducer
  • (C#)一个最简单的链表类
  • (ZT) 理解系统底层的概念是多么重要(by趋势科技邹飞)
  • (八十八)VFL语言初步 - 实现布局
  • (层次遍历)104. 二叉树的最大深度
  • (分类)KNN算法- 参数调优
  • (附源码)spring boot智能服药提醒app 毕业设计 102151
  • (转)Mysql的优化设置
  • ./configure,make,make install的作用(转)
  • .bat批处理(四):路径相关%cd%和%~dp0的区别
  • .h头文件 .lib动态链接库文件 .dll 动态链接库
  • .NET Core引入性能分析引导优化
  • .NET delegate 委托 、 Event 事件,接口回调
  • .NET Standard 的管理策略
  • .NET 设计一套高性能的弱事件机制
  • .NET分布式缓存Memcached从入门到实战
  • @SentinelResource详解
  • [ Linux 长征路第五篇 ] make/Makefile Linux项目自动化创建工具
  • [ vulhub漏洞复现篇 ] Django SQL注入漏洞复现 CVE-2021-35042
  • [.NET]桃源网络硬盘 v7.4
  • [20171102]视图v$session中process字段含义
  • [ajaxupload] - 上传文件同时附件参数值
  • [APIO2015]巴厘岛的雕塑