当前位置：首页 > news >正文

科研数据分析常见问题

news 来源：原创 2024/6/30 0:23:29

许多使用SPSSAU进行初次科研数据分析的同学，可能对数据分析方法的深层原理和研究思路缺乏全面的把握。因此，当导师针对数据研究方法提出具体问题时，他们可能会感到些许困惑或难以立即给出满意的答复。鉴于此，SPSSAU汇总了一些常见的数据分析相关的答辩问题，旨在为大家在论文答辩中提供有力的支持，确保答辩过程更加顺畅。

一、科研数据分析类常见问题

科研数据分析涉及的方法多种多样，这里没办法全部涉及，所以给大家提供答辩问题的回答方向，同学们可以按照以下套路模板进行举一反三。

Q1、论文为什么选择这个研究方法or模型？

如果论文中含有实证部分，那么实证分析中所用的方法/模型是导师们最喜欢提问的超高频问题。包括研究方法/模型的基本含义、算法原理、研究假设与论文的适配情况等。

回答方向：

首先表明自己在撰写论文时，深入阅读并总结了大量与本研究相关的参考文献，通过对这些文献的细致研究，充分理解了xx研究方法/模型的原理和作用。在掌握了这些基础之后，结合自己的课题研究目的，对相同研究领域的多个方法进行了仔细的比较和分析。经过深思熟虑，最终决定采用xx方法对我的论文进行深入研究。

这就要求你一定要对自己论文所用方法/模型的基本原理、以及分析步骤有一定的了解，最好能用简短的几句话概括出自己对该方法的理解。有关分析方法的原理，可以在答辩前，拿出5分钟的时间阅读帮助手册内容，就可以大概了解每一种分析方法原理以及需要注意的关键点，而这些同时也是导师比较爱提问的点。

比如权重计算方法中主观赋权常用方法——层次分析法帮助手册介绍的原理与分析步骤如下：

Q2、请简单介绍一下你运用的这个研究方法？

这个问题的答案导师想听的一定不是书上的定义或者百度百科上拗口的解释（而且答辩紧张的情况下你可能都忘记了），他想听到的一定是你自己对于该方法的认识以及理解，最好使用大白话进行解释。

回答方向：

百度百科对于TOPSIS法的解释如下：

你可以参考SPSSAU帮助手册说明这样简单的用一两句话介绍TOPSIS法：

Q3、论文数据是否可靠？是如何得到的？

如果不是纯纯纯文科生，那么论文中肯定或多或少都会有用到数据。如果用到了数据，那么数据的收集和处理也都是导师喜欢提问的高频问题。

回答方向：

如果数据是自己收集的，那么如实回答即可。比如常见的收集数据方式有统计局官网等网络调查法收集整理的数据、通过问卷方式收集的数据、通过访谈调研等方式收集的数据，此类情况表述清楚即可。但是如果数据来源“不详”，那么一定要确保能够“自圆其说”，有些小改动老师可能看不出来，但是错误极其明显的，还是不要抱有侥幸心理，还想蒙混过关，所以答辩前务必自己再检查数据一遍，做到心中有数。

Q4、论文样本、变量等指标是如何选取的？

样本、变量等指标选取问题，肯定不能是自己拍脑袋确定的，一定要有相关文献支撑。比较常见的问题是指标的选取是否做到完整、没有遗漏、样本选择是否合理、是否考虑了控制变量等。

回答方向：

表明自己是在查阅了相关文献后，才确定了论文中所用的几类指标。（小技巧：文献综述部分一般都会写相关方向的一些研究，可以在回答时结合文献综述部分进行举例说明，导师不会一个一个去核实文献中是否含有你所说的的变量）。但是能做每个指标的选取都有理有据是最好的。

Q5、数据中异常值、缺失值等是如何处理的？

与论文数据相关的提问，除了数据的收集之外，另一个比较提问的点就是数据处理相关问题。包括数据预处理、异常值、缺失值、无效样本的处理、论文所用研究方法中数据的处理方式等几个方面。

回答方向：

可以先简单介绍一下论文收集数据中是否有异常值、缺失值、无效样本，以及各自所占的比例情况。然后针对异常值进行了怎样的处理、针对缺失值进行了怎样的处理。可以查看下方SPSSAU有关异常值和无效样本的帮助手册说明

Q6、数据分析前原始数据是如何处理的？

不同指标之间由于量纲不同导致的不具有可比性，所以需要先进行无量纲化处理；它是通过数据变换来消除原始变量的量纲影响的方法；消除量纲影响后再进行后续分析。

回答方向：

比如常见的因子分析、主成分分析需要对原始数据进行标准化处理；熵值法、TOPSIS法需要对数据进行正向化逆向化处理。这部分在你论文实证分析部分肯定都有写，答辩前记得再看一看。

Q7、实证分析相关专业知识的提问？

如果遇见实证分析相关专业知识的问题，那么对同学们就是比较困难的了。一般遇到这样的提问，说明你的实证部分是存在一些明显的错误的。如果在论文中比较完整介绍了实证分析的过程并且没有明显错误时，通常导师不会再提问的。

回答方向：

在答辩之前，仔细检查自己论文的实证部分，包括文字表述、操作步骤、计算公式、分析结论等是否有存在可能出错的部分，或者前后结论矛盾等非常明显的错误。如果答辩时遇到此类提问，自己不太有把握能回答的：可以试着能回答多少是多少，简单地说明自己的理解，争取导师的提示，巧妙应对。如果一点思路都没有、没办法回答的：应该大大方方的承认自己确实对这个问题没有研究清楚，并表示后面一定会认真研究这个问题。绝对不可以吞吞吐吐、抓耳挠腮、强词夺理地进行狡辩，会给导师留下非常不好的印象。

Q8、论文中相关专业名词解释的提问？

需要你解释的相关专业名词一般都是你的论文中出现的，可以自己去看论文中哪些名词是你不知道如何理解且可能和你专业相关的（实证分析部分，比如原理概念那里可能出现的），稍加准备一下。

回答方向：

比如因子分析中有很多的专业名词，如KMO、Bartlett球形度检验、特征根、方差解释率等。这类研究方法中的专业名词也可以查看SPSSAU帮助手册说明，帮助手册中对于每一个第一次出现的名词都会提供通俗易懂的解释说明，帮助大家理解。如下图：

Q9、图、表的格式、内容是否符合学术规范？

学术论文对于图、表的要求都比较严格。通常表格都是标准的三线表格式，表格所包含的内容也应该符合学术规范，知道什么需要展示，什么不需要展示。

回答方向：

首先说明论文是通过使用SPSS、SPSSAU、Excel、Stata等主流分析软件得到的分析结果，并且参考了相关文献的规范格式后进行整理输出的，是符合学术规范的。

如果你是用SPSSAU进行的数据分析部分，那么得到的分析表格和图片都是完全符合学术规范的。如果不是用SPSSAU进行分析的，那么也可以参考SPSSAU的输出结果进行三线表分析结果的整理。输出分析结果示例：

Q10、数据分析使用什么软件进行的？

如果问到数据分析部分是使用什么软件进行的，那么基本就是答辩的送分题了，如实回答即可。目前本科生阶段比较常用的数据分析软件主要有SPSS、SPSSAU、Stata、SAS、Excel等。只要不是太小众的，无法保证数据分析结果准确性的软件即可。

二、常用方法的相关问题举例

每个人的论文涉及的数据分析方法都不同，那么如何才能知道自己用的方法相关的疑难问题有哪些呢？——推荐大家看看SPSSAU分析方法帮助手册的最下方，都有疑难问题汇总解答。

下面简单举几个数据分析经典问题。

Q1、回归模型是否考虑了多重共线性问题？

在多元线性回归模型中，自变量X之间线性相关的现象被称为多重共线性。如果两个自变量之间相关系数较大且接近1，则可认为回归模型中存在多重共线性问题。相关系数检验法可作为初步判断共线性的一种方法。VIF值是方差膨胀因子，反映了自变量是否存在多重共线性，可以衡量多重共线性的严重程度。一般认为VIF值大于10，则存在多重共线性问题（严格大于5）。

Q2、非标准化回归系数与标准化回归系数有何区别？

非标准化回归系数：构建回归模型使用非标准化回归系数，它是方程中不同自变量对应的原始回归系数，反映了在其他自变量不变的情况下，该自变量每变化一个单位对因变量作用的大小。通过非标准化回归系数构建的回归方程，才可以对因变量进行预测。
标准化回归系数：自变量对因变量影响大小的比较是通过标准化回归系数进行比较的。标准化回归系数，是对自变量和因变量同时进行标准化处理后所得到的回归系数，数据经过标准化处理后消除了量纲、数量级等差异的影响，使得不同变量之间具有可比性。

Q3、量表的可靠性怎么保证？

通过信效度分析确保量表的可靠性。

信度分析用于测量样本回答结果是否可靠，即样本有没有真实作答量表类题项。克隆巴赫信度系数如果在0.8以上,则该测验或量表的信度非常好；信度系数在0.7以上都是可以接受；如果在0.6以上，则该量表应进行修订；如果低于0.6，量表就需要重新设计题项。
效度分析用于测量题项(定量数据)设计是否合理，通过探索性因子分析方法进行验证；心中预期的变量与题项对应关系，进行因子分析后，因子与题项对应关系二者预期基本一致时，则说明具有良好效度水平。

更多问题可以参考相关研究方法SPSSAU帮助手册。