当前位置: 首页 > news >正文

【机器学习理论基础】定量变量和定性变量

一 定量变量和定性变量

1.1 定量变量(quantitative variable)

取值是定量的,有计算意义的。如年龄、家庭人口数量这类变量。

1.2 定性变量(quanlitative variable)

取值是定性的,主要起代号作用。如学历、婚姻状况和就业情况等。
为了对定性变量进行统计学处理,往往需要对其进行编码处理,如性别“男为0,女为1”。所以,在实际的统计工作中,不需要输入汉字,而是将其转换为相应的数字。

变量取值举例
定量变量取值是定量的、有计算意义的年龄、家庭人口数
定性变量取值是定性的、主要起代号作用学历、婚姻状况和就业情况

二 连续变量和离散变量

2.1 连续变量(continuous variable)

取值范围在理论上是连续不断的。如年龄变量的取值范围在理论上可以取任意正实数,注意不是正整数,比如一个人的年龄可以记为17.55岁,表示年龄为17岁6个月18天,甚至还可以利用出生时刻的信息精确到更小的时间单位(如“分、秒”)。

2.2 离散变量

取值范围是间断而不连续的。如家庭人口数这一变量就是相对于连续变量的另一类,即,因为不同家庭的人口数只可能相差0、1、2,而不能相差1.1、1.2等。

变量取值举例
连续变量取值范围理论上是连续不断的年龄变量
离散变量取值范围间断而不连续家庭人口数

由此可见,一般仅定量变量有连续和离散之分,即一个定量变量要么是连续的、要么是离散的。
相较而言,定性变量从数据表现上虽然和离散变量类似,但由于它只具有“代号”意义,所以一般不把它视为离散变量。

变量取值举例连续变量/离散变量
定量变量取值是定量的、有计算意义的年龄、家庭人口数有连续和离散之分
定性变量取值是定性的、主要起代号作用学历、婚姻状况和就业状况不把它视为离散变量

三 定性变量的分类

定性变量的取值往往表现为互不交叉的类别(所以定性变量也称分类变量),同时这些类别有时会存在细微的差别。

3.1 有序分类变量

如学历这类定性变性变量的取值为“文盲、小学、初中、高中……”,透露出一种等级或顺序的感觉,因此也称之为有序分类变量,这是指其取值的各类别之间存在着程度上的差别。
另外一个常见的例子是“满意程度”,包括“很不满意、不满意、一般、满意、非常满意”。这类有序分类变量给人一种“半定量”的感觉,也称为“等级变量”;

变量取值举例
有序分类变量取值的各类别之间存在着程度上的差别学历
等级变量满意程序

3.2 无序分类变量

与之相对的另一类定性变量,即无序分类变量,其各个取值则不存在程度的差异,比如性别、血型等。

变量取值举例
有序分类变量取值的各类别之间存在着程度上的差别学历
无序分类变量取值的各类别之间不存在着程度上的差别性别、血型

对于无序分类变量,根据取值的不同又可分为“二项分类变量”和“多项分类变量”,比如性别(一般情况)只分为男女两类,所以称之为二分类,而血型类别较多,可称为多分类。

变量取值举例
无序分类变量二项分类变量性别
无序分类变量多项分类变量血型

参考链接

  • http://www.360doc.com/content/23/0525/06/65434111_1082027721.shtml

相关文章:

  • 30岁迷茫?AI赛道,人生新起点
  • 【ArcGIS微课1000例】0115:字段数据类型案例详解
  • 计算广告读书杂记-待整理
  • 【AI大模型】Transformers大模型库(七):单机多卡推理之device_map
  • 基于SWIFT和Qwen1.5-14B-Chat进行大模型LoRA微调测试
  • 易舟云财务软件:数字化时代的财务管家
  • C/C++ 进阶(6)红黑树
  • Linux基础 (十四):socket网络编程
  • Ansible——fetch模块
  • 计划任务 之 一次性的计划任务
  • Java与MySQL的数据迁移与同步及事务与性能抉择
  • SQL进阶day12——高级条件语句
  • JMH309【亲测】典藏3D魔幻端游【剑踪3DⅢ】GM工具+开区合区工具+PC客户端+配置修改教程+Win一键服务端+详细外网视频教程
  • 那些年我看过的技术书(持续更新,大佬的成长之路)
  • 输入apt update 报错无法获得锁 /var/lib/apt/lists/lock, 锁正由进程1974持有
  • classpath对获取配置文件的影响
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • HTTP请求重发
  • java概述
  • JS正则表达式精简教程(JavaScript RegExp 对象)
  • mysql innodb 索引使用指南
  • opencv python Meanshift 和 Camshift
  • RxJS 实现摩斯密码(Morse) 【内附脑图】
  • Spring Security中异常上抛机制及对于转型处理的一些感悟
  • vuex 笔记整理
  • Webpack 4x 之路 ( 四 )
  • 创建一种深思熟虑的文化
  • 大快搜索数据爬虫技术实例安装教学篇
  • 理解 C# 泛型接口中的协变与逆变(抗变)
  • 码农张的Bug人生 - 初来乍到
  • 算法-图和图算法
  • 用Python写一份独特的元宵节祝福
  • hi-nginx-1.3.4编译安装
  • 阿里云服务器如何修改远程端口?
  • # 执行时间 统计mysql_一文说尽 MySQL 优化原理
  • #数学建模# 线性规划问题的Matlab求解
  • (6)添加vue-cookie
  • (Git) gitignore基础使用
  • (solr系列:一)使用tomcat部署solr服务
  • (附源码)ssm航空客运订票系统 毕业设计 141612
  • (附源码)计算机毕业设计ssm基于B_S的汽车售后服务管理系统
  • (论文阅读31/100)Stacked hourglass networks for human pose estimation
  • (免费领源码)python#django#mysql校园校园宿舍管理系统84831-计算机毕业设计项目选题推荐
  • (三)docker:Dockerfile构建容器运行jar包
  • (十六)Flask之蓝图
  • .360、.halo勒索病毒的最新威胁:如何恢复您的数据?
  • .dat文件写入byte类型数组_用Python从Abaqus导出txt、dat数据
  • .net core 依赖注入的基本用发
  • .NET/C# 如何获取当前进程的 CPU 和内存占用?如何获取全局 CPU 和内存占用?
  • .NET开源全面方便的第三方登录组件集合 - MrHuo.OAuth
  • .php文件都打不开,打不开php文件怎么办
  • [@Controller]4 详解@ModelAttribute
  • [④ADRV902x]: Digital Filter Configuration(发射端)
  • [android] 切换界面的通用处理
  • [BUUCTF]-Reverse:reverse3解析