三因素方差分析_菜鸟也爱数据分析之SPSS篇——多因素方差分析
一前言
上一篇,我们基于不同高峰时间范围的用电满意度的市场调查的数据,用单因素方差分析方法来帮助电力部门决策了是否需要分时段定电价的问题。好了,现在我们得出结论:分时段定电价是有必要的,那么如何来做分时段电价的方案呢,我们又要用到数据和数据分析啦。
二继续上一篇的栗子
我们来继续上一篇的栗子,第一步还是做市场调查,不过现在的调查内容会多一点,我们主要会考虑两个因素,一是电价比,即高峰电价与非高峰电价之间的比较,二是高峰时间范围。电价比选择三个水平,分别是1.5:1、2:1和3:1,高峰时间范围还是选用原来的3小时、5小时、7小时和9小时。在随机确定的受试对象中,要求他们对两个因素搭配下的用电满意度进行评分,评分值从60~100分,分值越高说明满意度越高,分值越低说明满意度越低。
根据排列组合,电价比与高峰时间范围的搭配方案有6种,那么各种方案下的满意度有没有差别呢,有的话,哪一种搭配方案下的满意度最高呢,这会我们就要用上多因素方差分析啦。你可能会说,有了上一篇单因素方差分析的基础,多因素方差分析不是类似么。嗯,是的,不过多因素方差分析考虑的东西可比单因素方差分析多了一点,你大概会说有那么麻烦么,其实也不麻烦,往下看。
三小白理解多因素方差分析
类似于单因素方差分析,多因素方差分析的核心内容则为,检验在不同控制变量的不同交叉水平下,各交叉分组下样本数据所来自的总体均值,有无显著性差异,进而判断多个因素是否对观测变量产生了显著影响。如果有显著影响,我们以两个控制因素A与B为例,那么观测变量的差异,我们则需要考虑是由控制因素A、B对观测变量的独立影响,以及控制因素A、B的交互作用,最后还有随机因素四个部分共同影响。
这里我们再来理解一下交互作用,即两个或多个控制变量在各水平搭配下对观测变量的影响。如果一个控制因素所产生的效应在另一个控制因素的不同水平下有明显差异,则称该两控制因素存在交互作用。
这种情况下,当A从A1变化到A2时,观测变量均值增加幅度相同,与B无关,则控制因素A与B不存在交互作用。
这种情况下,当A从A1变化到A2时,观测变量均值的变化与B的取值有关,则控制因素A与B存在交互作用。
3. 前提条件
多因素方差分析的前提条件与单因素方差分析的前提条件类似,这里我们就不在累述了。
四多因素方差分析实战
Step1: 在SPSS中打开数据文件“满意度调查数据.sav”,如图1.1。
图1.1
Step2:单击【分析】菜单,选择【一般线性模型】菜单,选择【单变量】菜单,弹出对话框,并选择评分为因变量,选择高峰时间和电价比为固定因子,如图1.2。
图1.2
这里我们解释下固定因子,指的是控制因素的所有可能水平在样本中都出现,针对该因素而言,从样本的分析结果中就可以得知所有水平的状况,无需外推。那么很显然,我们已经选定了高峰时间范围的电价比这两个控制因素的水平,属于固定因子。
Step3:单击【模型】选项卡,弹出对话框如图1.3。
图1.3
这里我们不做改动选用全因子模型,既默认将控制因素之间的交互作用也考虑进去。在某些情况下,如果我们认为控制因素之间没有交互作用,那么我们可以选择设定,构建项选择主效应。
Step4:回到主界面,单击【两两比较】选项卡,将高峰时间和电价比选入两两比较对检验,如图1.4。假定方差齐性中选择LSD(L),SNK(S),这两种方法在上一篇单因素方差分析已经提过,就不累述了。
图1.4
Step5:回到主界面,再单击【选项】选项卡,选择描述性(D),方差同质性检验(H),如图1.5。
图1.5
选完之后,回到主界面,点击确定,多因素方差分析就搞定了!和上一篇一样,下面我们来看下结果解读。
五多因素方差分析结果解读
首先,输出结果一,主体间因子和描述性统计量,如图1.6和图1.7。
图1.6
图1.7
输出结果二,方差齐性检验,如图1.8。
图1.8
图1.8是多因素方差分析的齐性检验结果,从结果中可以看出,Levene统计量的sig值为0.233,大于显著性水平0.05,因此总体方差无显著性差异既总体方差齐性,满足多因素方差分析的前提条件。
输出结果三,主体间效应的检验表,如图1.9。
图1.9
图1.9为主体间效应的检验表,这里我们首先来看两个控制因素对观测变量的独立影响。从表格中可以看出,控制因素高峰时间对应F统计量的sig值均小于0.05,说明高峰时间对用电满意度产生了显著影响。同理,电价比的F统计量的sig值均小于0.05,说明电价比对用电满意度也产生了显著影响。接下类,我们再看一下高峰时间*电价比,这代表这两个因素的交互作用,这里对应的F统计量的sig值为0.265,说明高峰时间与电价比的交互作用对用电满意度并未产生显著影响。
此时,我们可以将整个模型简化,在模型选择对话框中,选择设定,构建项选择主效应,如图1.10。
图1.10
经过简化模型后,此时我们得到新的主体间效应的检验表,如图1.11。
图1.11
输出结果四,多重比较结果表,如图1.12、图1.13、图1.14、图1.15。
高峰时间的LSD法比较结果
图1.12
高峰时间的SNK法比较结果
图1.13
从图1.12和图1.13可以看出,高峰时间3小时和5小时为一类,均值为74.06和77;高峰时间7小时和9小时为一类,均值为84.56和84.78。
电价比的LSD法比较结果
图1.14
电价比的SNK法比较结果
图1.15
从图1.14和图1.15可以看出,电价比三个水平分为三类,其中电价比1.5的用电满意度最高。
好了,我们综合起来看一下,高峰时间范围和电价比搭配对用电满意度的影响是显著的,在电价比为1.5:1,高峰时间段为9小时下,用户的满意评分值最高。于是电力部门就选择最优的搭配方案,高峰时间范围和电价比方案为电价比为1.5:1,高峰时间段为9小时。