当前位置: 首页 > news >正文

spss-数据抽取-拆分与合并

spss-数据抽取-拆分与合并

数据抽取也成为数据拆分,是指保留、抽取原数据表中某些字段、记录的部分信息,形成一个新字段、新纪录。分为:字段拆分和随机抽样两种方法。

一:字段拆分

如何提取“身份证号码”字段。身份证号码里面包含了许多信息,例如省份、城市、出生日期、性别等等。我们将它抽取出来,就可以得到相应的字段。也就可以做相应的分析了。如用户的省份分布、出生日期、性别等。

大家都知道在excel中使用字符函数(right、mid、left)就可以将这些信息提取出来。那么在spss中该如何使用呢?接下来教给大家一个在spss中的函数方法。

Substr函数,它跟excel中的mid函数的用法是一致的。函数如下:

Substr(字符串 , 提取的起始位置 , 提取的字符个数)

操作步骤:

【转换】--【计算变量】,弹出【计算变量】对话框,如图

首先在【函数组】框中找到“字符串”类,在【函数和特殊变量】中选择“char.substr(3)”函数,双击,这时该函数就会被移入【数字表达式】框中,然后将表达式修改为“CHAR.SUBSTR(身份证号码,7,4)”,这样就完成了公式的编写。

接着在【目标变量】框中,输入变量名称“年份”,并在【类型与便签】功能中设置为“字符串”

最后点击【确定】按钮。这样就新增加了一个变量“年份”。

拓展:SPSS中计算变量这个功能非常常用,类似于excel的编辑栏功能,可以输入函数或者计算公式来新增变量,后续还会使用它来进行相关的数据处理操作。

二:数据合并

数据合并是指综合数据表中某几个字段的信息或记录,组合成一个新字段、新记录。主要分为两种:A、字段合并、B、记录合并。

A、字段合并,是指将几个字段合并为一个新字段。例如将前面从身份证号码中提取出来的年、月、日三个单独的字段进行合并,得到出生日期。

介绍一个函数concat

操作步骤如上

最后新增加一步:如果想要对年龄进行计算,需要将变量视图中“出生日期2”的数据类型更改为日期。

B、记录合并,也称纵向合并。是将具有共同的数据字段、结构,不同的数据记录表信息合并的一个新的数据表中。数据分析师培训

操作步骤:

【数据】-【合并文件】-【添加个案】,弹出【添加个案】对话框。

选择【浏览】,打开文件

点击【继续】按钮。

如果正确,点击【确定】按钮。完成男女数据合并工作。

转载于:https://www.cnblogs.com/amengduo/p/9587171.html

相关文章:

  • flex metadata tag学习
  • 201521123108 《Java程序设计》第2周学习总结
  • flex子组件关闭父组件
  • Eclipse安装svn插件问题解决
  • 利用chmod获取权限
  • tomcat一闪而过解决方法
  • APP加固
  • jforum开源论坛安装
  • Vue.js之组件(component)
  • jforum架构和主要配置文件的说明
  • Axure--一个很好的原型设计软件
  • flex程序初始化顺序
  • [C/C++] C/C++中数字与字符串之间的转换
  • flex datagrid 设置超链接
  • 攻克vue路由
  • 【MySQL经典案例分析】 Waiting for table metadata lock
  • 【译】React性能工程(下) -- 深入研究React性能调试
  • Android系统模拟器绘制实现概述
  • ES学习笔记(10)--ES6中的函数和数组补漏
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • isset在php5.6-和php7.0+的一些差异
  • React-flux杂记
  • 案例分享〡三拾众筹持续交付开发流程支撑创新业务
  • 从零开始在ubuntu上搭建node开发环境
  • 快速构建spring-cloud+sleuth+rabbit+ zipkin+es+kibana+grafana日志跟踪平台
  • 爬虫进阶 -- 神级程序员:让你的爬虫就像人类的用户行为!
  • 前端攻城师
  • 前端面试之CSS3新特性
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 算法系列——算法入门之递归分而治之思想的实现
  • 提醒我喝水chrome插件开发指南
  • 如何用纯 CSS 创作一个货车 loader
  • "无招胜有招"nbsp;史上最全的互…
  • $.ajax()方法详解
  • (C语言)字符分类函数
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (二)PySpark3:SparkSQL编程
  • (二)学习JVM —— 垃圾回收机制
  • (附源码)ssm高校运动会管理系统 毕业设计 020419
  • (每日持续更新)jdk api之FileFilter基础、应用、实战
  • (十二)springboot实战——SSE服务推送事件案例实现
  • (十六)一篇文章学会Java的常用API
  • (十三)Java springcloud B2B2C o2o多用户商城 springcloud架构 - SSO单点登录之OAuth2.0 根据token获取用户信息(4)...
  • (转)shell中括号的特殊用法 linux if多条件判断
  • .apk 成为历史!
  • .FileZilla的使用和主动模式被动模式介绍
  • .NET “底层”异步编程模式——异步编程模型(Asynchronous Programming Model,APM)...
  • .net core 依赖注入的基本用发
  • .NET delegate 委托 、 Event 事件
  • .net 开发怎么实现前后端分离_前后端分离:分离式开发和一体式发布
  • .pings勒索病毒的威胁:如何应对.pings勒索病毒的突袭?
  • [ C++ ] STL priority_queue(优先级队列)使用及其底层模拟实现,容器适配器,deque(双端队列)原理了解
  • [ vulhub漏洞复现篇 ] JBOSS AS 5.x/6.x反序列化远程代码执行漏洞CVE-2017-12149
  • [BJDCTF 2020]easy_md5