当前位置: 首页 > news >正文

科研数据分析常见问题

许多使用SPSSAU进行初次科研数据分析的同学,可能对数据分析方法的深层原理和研究思路缺乏全面的把握。因此,当导师针对数据研究方法提出具体问题时,他们可能会感到些许困惑或难以立即给出满意的答复。鉴于此,SPSSAU汇总了一些常见的数据分析相关的答辩问题,旨在为大家在论文答辩中提供有力的支持,确保答辩过程更加顺畅。

一、科研数据分析类常见问题

科研数据分析涉及的方法多种多样,这里没办法全部涉及,所以给大家提供答辩问题的回答方向,同学们可以按照以下套路模板进行举一反三。

Q1、论文为什么选择这个研究方法or模型?

如果论文中含有实证部分,那么实证分析中所用的方法/模型是导师们最喜欢提问的超高频问题。包括研究方法/模型的基本含义、算法原理、研究假设与论文的适配情况等。

回答方向:

首先表明自己在撰写论文时,深入阅读并总结了大量与本研究相关的参考文献,通过对这些文献的细致研究,充分理解了xx研究方法/模型的原理和作用。在掌握了这些基础之后,结合自己的课题研究目的,对相同研究领域的多个方法进行了仔细的比较和分析。经过深思熟虑,最终决定采用xx方法对我的论文进行深入研究。

这就要求你一定要对自己论文所用方法/模型的基本原理、以及分析步骤有一定的了解,最好能用简短的几句话概括出自己对该方法的理解。有关分析方法的原理,可以在答辩前,拿出5分钟的时间阅读帮助手册内容,就可以大概了解每一种分析方法原理以及需要注意的关键点,而这些同时也是导师比较爱提问的点。

比如权重计算方法中主观赋权常用方法——层次分析法帮助手册介绍的原理与分析步骤如下:

Q2、请简单介绍一下你运用的这个研究方法?

这个问题的答案导师想听的一定不是书上的定义或者百度百科上拗口的解释(而且答辩紧张的情况下你可能都忘记了),他想听到的一定是你自己对于该方法的认识以及理解,最好使用大白话进行解释。

回答方向:

百度百科对于TOPSIS法的解释如下:


你可以参考SPSSAU帮助手册说明这样简单的用一两句话介绍TOPSIS法:

Q3、论文数据是否可靠?是如何得到的?

如果不是纯纯纯文科生,那么论文中肯定或多或少都会有用到数据。如果用到了数据,那么数据的收集和处理也都是导师喜欢提问的高频问题。


回答方向:

如果数据是自己收集的,那么如实回答即可。比如常见的收集数据方式有统计局官网等网络调查法收集整理的数据、通过问卷方式收集的数据、通过访谈调研等方式收集的数据,此类情况表述清楚即可。但是如果数据来源“不详”,那么一定要确保能够“自圆其说”,有些小改动老师可能看不出来,但是错误极其明显的,还是不要抱有侥幸心理,还想蒙混过关,所以答辩前务必自己再检查数据一遍,做到心中有数。

Q4、论文样本、变量等指标是如何选取的?

样本、变量等指标选取问题,肯定不能是自己拍脑袋确定的,一定要有相关文献支撑。比较常见的问题是指标的选取是否做到完整、没有遗漏、样本选择是否合理、是否考虑了控制变量等。

回答方向:

表明自己是在查阅了相关文献后,才确定了论文中所用的几类指标。(小技巧:文献综述部分一般都会写相关方向的一些研究,可以在回答时结合文献综述部分进行举例说明,导师不会一个一个去核实文献中是否含有你所说的的变量)。但是能做每个指标的选取都有理有据是最好的。

Q5、数据中异常值、缺失值等是如何处理的?

与论文数据相关的提问,除了数据的收集之外,另一个比较提问的点就是数据处理相关问题。包括数据预处理、异常值、缺失值、无效样本的处理、论文所用研究方法中数据的处理方式等几个方面。

回答方向:

可以先简单介绍一下论文收集数据中是否有异常值、缺失值、无效样本,以及各自所占的比例情况。然后针对异常值进行了怎样的处理、针对缺失值进行了怎样的处理。可以查看下方SPSSAU有关异常值和无效样本的帮助手册说明

Q6、数据分析前原始数据是如何处理的?

不同指标之间由于量纲不同导致的不具有可比性,所以需要先进行无量纲化处理;它是通过数据变换来消除原始变量的量纲影响的方法;消除量纲影响后再进行后续分析。

回答方向:

比如常见的因子分析、主成分分析需要对原始数据进行标准化处理;熵值法、TOPSIS法需要对数据进行正向化逆向化处理。这部分在你论文实证分析部分肯定都有写,答辩前记得再看一看。

Q7、实证分析相关专业知识的提问?

如果遇见实证分析相关专业知识的问题,那么对同学们就是比较困难的了。一般遇到这样的提问,说明你的实证部分是存在一些明显的错误的。如果在论文中比较完整介绍了实证分析的过程并且没有明显错误时,通常导师不会再提问的。

回答方向:

在答辩之前,仔细检查自己论文的实证部分,包括文字表述、操作步骤、计算公式、分析结论等是否有存在可能出错的部分,或者前后结论矛盾等非常明显的错误。如果答辩时遇到此类提问,自己不太有把握能回答的:可以试着能回答多少是多少,简单地说明自己的理解,争取导师的提示,巧妙应对。如果一点思路都没有、没办法回答的:应该大大方方的承认自己确实对这个问题没有研究清楚,并表示后面一定会认真研究这个问题。绝对不可以吞吞吐吐、抓耳挠腮、强词夺理地进行狡辩,会给导师留下非常不好的印象。

Q8、论文中相关专业名词解释的提问?

需要你解释的相关专业名词一般都是你的论文中出现的,可以自己去看论文中哪些名词是你不知道如何理解且可能和你专业相关的(实证分析部分,比如原理概念那里可能出现的),稍加准备一下。

回答方向:

比如因子分析中有很多的专业名词,如KMO、Bartlett球形度检验、特征根、方差解释率等。这类研究方法中的专业名词也可以查看SPSSAU帮助手册说明,帮助手册中对于每一个第一次出现的名词都会提供通俗易懂的解释说明,帮助大家理解。如下图:

Q9、图、表的格式、内容是否符合学术规范?

学术论文对于图、表的要求都比较严格。通常表格都是标准的三线表格式,表格所包含的内容也应该符合学术规范,知道什么需要展示,什么不需要展示。

回答方向:

首先说明论文是通过使用SPSS、SPSSAU、Excel、Stata等主流分析软件得到的分析结果,并且参考了相关文献的规范格式后进行整理输出的,是符合学术规范的。

如果你是用SPSSAU进行的数据分析部分,那么得到的分析表格和图片都是完全符合学术规范的。如果不是用SPSSAU进行分析的,那么也可以参考SPSSAU的输出结果进行三线表分析结果的整理。输出分析结果示例:

Q10、数据分析使用什么软件进行的?

如果问到数据分析部分是使用什么软件进行的,那么基本就是答辩的送分题了,如实回答即可。目前本科生阶段比较常用的数据分析软件主要有SPSS、SPSSAU、Stata、SAS、Excel等。只要不是太小众的,无法保证数据分析结果准确性的软件即可。

二、常用方法的相关问题举例

每个人的论文涉及的数据分析方法都不同,那么如何才能知道自己用的方法相关的疑难问题有哪些呢?——推荐大家看看SPSSAU分析方法帮助手册的最下方,都有疑难问题汇总解答。

下面简单举几个数据分析经典问题。

Q1、回归模型是否考虑了多重共线性问题?

在多元线性回归模型中,自变量X之间线性相关的现象被称为多重共线性。如果两个自变量之间相关系数较大且接近1,则可认为回归模型中存在多重共线性问题。相关系数检验法可作为初步判断共线性的一种方法。VIF值是方差膨胀因子,反映了自变量是否存在多重共线性,可以衡量多重共线性的严重程度。一般认为VIF值大于10,则存在多重共线性问题(严格大于5)。

Q2、非标准化回归系数与标准化回归系数有何区别?

  • 非标准化回归系数:构建回归模型使用非标准化回归系数,它是方程中不同自变量对应的原始回归系数,反映了在其他自变量不变的情况下,该自变量每变化一个单位对因变量作用的大小。通过非标准化回归系数构建的回归方程,才可以对因变量进行预测。
  • 标准化回归系数:自变量对因变量影响大小的比较是通过标准化回归系数进行比较的。标准化回归系数,是对自变量和因变量同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,使得不同变量之间具有可比性。

Q3、量表的可靠性怎么保证?

通过信效度分析确保量表的可靠性。

  • 信度分析用于测量样本回答结果是否可靠,即样本有没有真实作答量表类题项。 克隆巴赫信度系数如果在0.8以上,则该测验或量表的信度非常好;信度系数在0.7以上都是可以接受;如果在0.6以上,则该量表应进行修订;如果低于0.6,量表就需要重新设计题项。
  • 效度分析用于测量题项(定量数据)设计是否合理,通过探索性因子分析方法进行验证;心中预期的变量与题项对应关系,进行因子分析后,因子与题项对应关系二者预期基本一致时,则说明具有良好效度水平。

更多问题可以参考相关研究方法SPSSAU帮助手册。

三、答辩流程

①自我介绍:包括姓名、专业等,自我介绍时要举止大方、态度从容、面带微笑、礼貌得。

②答辩人陈述:结合PPT进行论文陈述,主要内容包括论文题目、研究背景、选题目的及意义、实证分析过程、研究结论等

③提问答辩:答辩教师在答辩人自述完成后,针对论文内容进行提问,一般由浅入深进行提问,有问有答,是答辩中相对灵活的环节

④结束致谢:答辩完成后,答辩人进行致谢,感谢导师们在毕业设计及论文写作方面给予的帮助,致谢完成后退场

⑤总结评定:参加答辩的学生致谢后退场,答辩委员会集体根据论文质量和答辩情况,商定是否通过,最后由主答辩老师小结,进行必要补充和指点

四、总结

  • 在答辩之前,对照SPSSAU帮助手册,仔细看一遍论文中涉及的分析方法相关知识;
  • 一定要对自己论文所用的方法、理论做到心中有数,导师提问不会脱离你的论文内容;
  • 会回答的,有把握讲清楚的:可以大方简单说明理由进行答辩;
  • 不太有把握讲清的、模棱两可的:可以尝试进行回答,争取导师提示,巧妙应对;
  • 完全不会的:大方承认自己对该问题尚未研究清楚,后面会仔细研究。
  • 当老师之处论文中明显的错误时,大方承认自己的不足,不要试图反驳和争论。

相关文章:

  • CSPM.pdf
  • 中国Scada市场现状,国内厂家已占领65%
  • springboot 集成minio 实现文件上传
  • 特别实用的8个机器学习算法总结!建议收藏,反复观看!
  • C++操纵符用法
  • 《庆余年算法番外篇》:范闲通过最短路径算法在阻止黑骑截杀林相
  • 【Linux】在Windows环境下配置两台Linux机器的文件互传
  • simulink基础学习笔记
  • 零基础学Java第二十七天之前端-HTML5详解
  • Golang编程语言:深度探索与应用实践
  • 521源码-源码下载-个人网盘源码2024最新web网盘系统源码一键安装版源码分享
  • [每周一更]-(第99期):MySQL的索引为什么用B+树?
  • openssl 常用命令demo
  • matlab GUI界面设计
  • openVPN+SmartDNS=openDNS or smartVPN?
  • 网络传输文件的问题
  • 分享的文章《人生如棋》
  • Django 博客开发教程 8 - 博客文章详情页
  • JavaScript创建对象的四种方式
  • Java-详解HashMap
  • PermissionScope Swift4 兼容问题
  • PhantomJS 安装
  • Redash本地开发环境搭建
  • Redis学习笔记 - pipline(流水线、管道)
  • Swift 中的尾递归和蹦床
  • 从0搭建SpringBoot的HelloWorld -- Java版本
  • 聊聊sentinel的DegradeSlot
  • 深度学习中的信息论知识详解
  • 十年未变!安全,谁之责?(下)
  • 用 Swift 编写面向协议的视图
  • 中文输入法与React文本输入框的问题与解决方案
  • ​二进制运算符:(与运算)、|(或运算)、~(取反运算)、^(异或运算)、位移运算符​
  • (ibm)Java 语言的 XPath API
  • (SpringBoot)第二章:Spring创建和使用
  • (动态规划)5. 最长回文子串 java解决
  • (含笔试题)深度解析数据在内存中的存储
  • (篇九)MySQL常用内置函数
  • (三)uboot源码分析
  • *setTimeout实现text输入在用户停顿时才调用事件!*
  • *上位机的定义
  • .dwp和.webpart的区别
  • .NET CORE 第一节 创建基本的 asp.net core
  • .NET Framework与.NET Framework SDK有什么不同?
  • .NET Standard 的管理策略
  • .NET 设计模式初探
  • .secret勒索病毒数据恢复|金蝶、用友、管家婆、OA、速达、ERP等软件数据库恢复
  • /tmp目录下出现system-private文件夹解决方法
  • @Autowired注解的实现原理
  • @RequestMapping 的作用是什么?
  • @RunWith注解作用
  • @test注解_Spring 自定义注解你了解过吗?
  • [2018/11/18] Java数据结构(2) 简单排序 冒泡排序 选择排序 插入排序
  • [ACM] hdu 1201 18岁生日
  • [Asp.net mvc]国际化
  • [BUUCTF]-PWN:[极客大挑战 2019]Not Bad解析