当前位置: 首页 > news >正文

R语言和医学统计学(5):多因素方差分析

本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文。

医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。

文章目录

    • 前言
    • 2 x 2 两因素析因设计资料的方差分析
    • I x J 两因素析因设计资料的方差分析
    • I x J x K 三因素析因设计资料的方差分析
    • 正交设计资料的方差分析

前言

这是R语言和医学统计学的第5篇内容。

主要是用R语言复现课本中的例子。我使用的课本是孙振球主编的《医学统计学》第4版,封面如下:

在这里插入图片描述

2 x 2 两因素析因设计资料的方差分析

使用课本例11-1的数据,自己手动摘录:

df11_1 <- data.frame(
  x1 = rep(c("外膜缝合","束膜缝合"), each = 10),
  x2 = rep(c("缝合1个月","缝合2个月"), each = 5),
  y = c(10,10,40,50,10,30,30,70,60,30,10,20,30,50,30,50,50,70,60,30)
)

str(df11_1)
## 'data.frame':	20 obs. of  3 variables:
##  $ x1: chr  "外膜缝合" "外膜缝合" "外膜缝合" "外膜缝合" ...
##  $ x2: chr  "缝合1个月" "缝合1个月" "缝合1个月" "缝合1个月" ...
##  $ y : num  10 10 40 50 10 30 30 70 60 30 ...

数据一共3列,第1列是缝合方法,第2列是时间,第3列是轴突通过率。

image-20220123152412218

进行析因设计资料的方差分析:

f1 <- aov(y ~ x1 * x2, data = df11_1)

summary(f1)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## x1           1    180     180   0.600 0.4499  
## x2           1   2420    2420   8.067 0.0118 *
## x1:x2        1     20      20   0.067 0.7995  
## Residuals   16   4800     300                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

结果显示了A因素主效应、B因素主效应、AB交互作用的自由度、离均差平方和、均方误差、F值、P值等,可以看到结果和课本是一致的!

简单介绍一下可视化两因素析因设计的方法:

interaction.plot(df11_1$x2, df11_1$x1, df11_1$y, type = "b", col = c("red","blue"), pch = c(12,15), xlab = "缝合时间", ylab = "轴突通过率")
plot of chunk unnamed-chunk-4

另外一种可视化方法:

library(gplots)
## 
## 载入程辑包:'gplots'
## The following object is masked from 'package:stats':
## 
##     lowess

attach(df11_1)

plotmeans(y ~ interaction(x1,x2),
          connect = list(c(1,3), c(2,4)),
          col = c("red","darkgreen"),
          main = "两因素析因设计",
          xlab = "时间和方法的交互")
plot of chunk unnamed-chunk-5

再介绍一种方法:

library(HH)
## 载入需要的程辑包:lattice
## 载入需要的程辑包:grid
## 载入需要的程辑包:latticeExtra
## 载入需要的程辑包:multcomp
## 载入需要的程辑包:mvtnorm
## 载入需要的程辑包:survival
## 载入需要的程辑包:TH.data
## 载入需要的程辑包:MASS
## 
## 载入程辑包:'TH.data'
## The following object is masked from 'package:MASS':
## 
##     geyser
## 载入需要的程辑包:gridExtra
## 
## 载入程辑包:'HH'
## The following object is masked from 'package:gplots':
## 
##     residplot

interaction2wt(y ~ x1 * x2)
plot of chunk unnamed-chunk-6
detach(df11_1)

I x J 两因素析因设计资料的方差分析

使用课本例11-2的数据,自己手动摘录:

df11_2 <- data.frame(
  druga = rep(c("1mg","2.5mg","5mg"), each = 3),
  drugb = rep(c("5微克","15微克","30微克"),each = 9),
  y = c(105,80,65,75,115,80,85,120,125,115,105,80,125,130,90,65,120,100,75,95,85,135,120,150,180,190,160)
)

str(df11_2)
## 'data.frame':	27 obs. of  3 variables:
##  $ druga: chr  "1mg" "1mg" "1mg" "2.5mg" ...
##  $ drugb: chr  "5微克" "5微克" "5微克" "5微克" ...
##  $ y    : num  105 80 65 75 115 80 85 120 125 115 ...

数据一共3列,第1列是a药物的剂量(3种剂量,代表3个水平),第2列是b药物的剂量(3种剂量),第3列是镇痛时间。

image-20220123152453553

进行两因素三水平的析因设计资料方差分析:

f2 <- aov(y ~ druga * drugb, data = df11_2)

summary(f2)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## druga        2   6572    3286   8.470 0.00256 **
## drugb        2   7022    3511   9.050 0.00190 **
## druga:drugb  4   7872    1968   5.073 0.00647 **
## Residuals   18   6983     388                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

结果和课本也是一模一样的哦!

I x J x K 三因素析因设计资料的方差分析

使用课本例11-3的数据,

df11_3 <- foreign::read.spss("E:/各科资料/医学统计学/研究生课程/析因设计重复测量/8多因素试验ANOVA18-9研/例11-03-5种军装热感觉5-2-2.sav", to.data.frame = T)

df11_3$a <- factor(df11_3$a)

str(df11_3)
## 'data.frame':	100 obs. of  4 variables:
##  $ b: Factor w/ 2 levels "骞茬嚗","娼箍": 1 1 1 1 1 1 1 1 1 1 ...
##  $ c: Factor w/ 2 levels "闈欏潗","娲诲姩": 1 1 1 1 1 1 1 1 1 1 ...
##  $ a: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 2 2 2 2 2 ...
##  $ x: num  0.25 -0.25 1.25 -0.75 0.4 ...
##  - attr(*, "variable.labels")= Named chr [1:4] "娲诲姩鐜" "娲诲姩鐘舵€\x81" "鍐涜绫诲瀷" "涓昏鐑劅瑙\x89"
##   ..- attr(*, "names")= chr [1:4] "b" "c" "a" "x"
##  - attr(*, "codepage")= int 65001

数据一共4列,前3列分别是b因素,c因素,a因素,每个因素有不同的水平,第4列是因变量(展示的图有乱码,不影响使用)。

image-20220123152530794

进行3因素吸引设计资料的方差分析:

f3 <- aov(x ~ b * c * a, data = df11_3)

summary(f3)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## b            1   9.94    9.94  23.138 6.98e-06 ***
## c            1 283.35  283.35 659.485  < 2e-16 ***
## a            4   5.20    1.30   3.024   0.0224 *  
## b:c          1  12.68   12.68  29.514 5.82e-07 ***
## b:a          4   1.94    0.48   1.128   0.3491    
## c:a          4   1.48    0.37   0.862   0.4905    
## b:c:a        4   1.61    0.40   0.937   0.4472    
## Residuals   80  34.37    0.43                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

结果也是和课本一模一样。

正交设计资料的方差分析

使用课本例11-4的数据

df11_4 <- data.frame(
  a = rep(c("5度","25度"),each = 4),
  b = rep(c(0.5, 5.0), each = 2),
  c = c(10, 30),
  d = c(6.0, 8.0,8.0,6.0,8.0,6.0,6.0,8.0),
  x = c(86,95,91,94,91,96,83,88)
)

df11_4$a <- factor(df11_4$a)
df11_4$b <- factor(df11_4$b)
df11_4$c <- factor(df11_4$c)
df11_4$d <- factor(df11_4$d)

str(df11_4)
## 'data.frame':	8 obs. of  5 variables:
##  $ a: Factor w/ 2 levels "25度","5度": 2 2 2 2 1 1 1 1
##  $ b: Factor w/ 2 levels "0.5","5": 1 1 2 2 1 1 2 2
##  $ c: Factor w/ 2 levels "10","30": 1 2 1 2 1 2 1 2
##  $ d: Factor w/ 2 levels "6","8": 1 2 2 1 2 1 1 2
##  $ x: num  86 95 91 94 91 96 83 88

数据一共5列,前4列是不同的因素,第5列是因变量。

image-20220123152754417

进行正交设计资料的方差分析:

f4 <- aov(x ~ a + b + c + d + a*b, data = df11_4)

summary(f4)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## a            1    8.0     8.0     3.2 0.2155  
## b            1   18.0    18.0     7.2 0.1153  
## c            1   60.5    60.5    24.2 0.0389 *
## d            1    4.5     4.5     1.8 0.3118  
## a:b          1   50.0    50.0    20.0 0.0465 *
## Residuals    2    5.0     2.5                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

结果和课本一模一样,用R语言进行方差分析真是太简单了!!!!

本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文。

医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化。

相关文章:

  • Python采集某网站小视频内容, m3u8内容下载
  • 云原生网络的微隔离实现技术
  • java计算机毕业设计书香校园阅读平台源程序+mysql+系统+lw文档+远程调试
  • TS扩展类型
  • DASCTF X GFCTF 2022十月挑战赛 Writeup
  • 你真的理解事件委托(事件代理)吗?
  • R语言和医学统计学(8):logistic回归
  • MATLAB | 绘图复刻(三) | 分层聚类分析图:树状图+热图
  • 大学生计算机相关专业有什么血泪建议吗?
  • 不愧是阿里面试官整理的java高级工程师面试 1000 题,面面俱到,太全了
  • 【开卷数据结构 】指针的初步认识
  • Python高级_第3章_HTTP协议与静态Web服务器开发
  • 创造一个表格编辑距离指标
  • 大数据Hadoop之——Apache Hudi 数据湖实战操作(FlinkCDC)
  • ikun网站成名录: HTML 中的常用标签用法,从0到1创建一个ikun简介
  • 《Javascript数据结构和算法》笔记-「字典和散列表」
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • CentOS7简单部署NFS
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • Github访问慢解决办法
  • javascript从右向左截取指定位数字符的3种方法
  • JavaScript实现分页效果
  • Nacos系列:Nacos的Java SDK使用
  • Node项目之评分系统(二)- 数据库设计
  • React的组件模式
  • Spark学习笔记之相关记录
  • 简析gRPC client 连接管理
  • 解决jsp引用其他项目时出现的 cannot be resolved to a type错误
  • 排序算法之--选择排序
  • 前端技术周刊 2019-02-11 Serverless
  • 入门级的git使用指北
  • 三栏布局总结
  • 什么软件可以剪辑音乐?
  • 协程
  • 一道面试题引发的“血案”
  • 译有关态射的一切
  • 正则学习笔记
  • Java性能优化之JVM GC(垃圾回收机制)
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • #vue3 实现前端下载excel文件模板功能
  • #WEB前端(HTML属性)
  • #前后端分离# 头条发布系统
  • %@ page import=%的用法
  • (11)MSP430F5529 定时器B
  • (翻译)terry crowley: 写给程序员
  • (机器学习的矩阵)(向量、矩阵与多元线性回归)
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (转)ORM
  • (转载)Google Chrome调试JS
  • .NET 3.0 Framework已经被添加到WindowUpdate
  • .net core 连接数据库,通过数据库生成Modell
  • .NET Core中Emit的使用
  • .NET Framework 4.6.2改进了WPF和安全性
  • .NET I/O 学习笔记:对文件和目录进行解压缩操作
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter