当前位置: 首页 > news >正文

R语言数据整理和分析(1)

跟着顶刊学习数据分析。本期参考文献《Trends in Dietary Vitamin A Intake Among US Adults by Race and Ethnicity, 2003-2018》,来源于JAMA,IF=63.1。

该文研究:2003-2018年美国成年人按种族和民族划分的膳食维生素A摄入量趋势

方法学:

该项研究使用的主要方法:Gamma广义线性回归模型用于估计黑人和西班牙裔参与者与白人参与者之间的平均维生素A摄入量差异。同时调整混杂因素并使用加权数据。

表:统计描述人口特征,未使用统计分析比较差异

这幅图涉及统计分析比较策略。(1)Gamma广义线性回归模型,评估同一种族人膳食维生素A的摄取趋势。(2)不同种族的比较,方差分析,对比是否有差异。

R语言实现Gamma广义线性模型:

# 假设 data 是你的数据框,其中包含列 y 和 x  
# 这里我们生成一些模拟数据作为示例  
set.seed(123) # 为了可重复性  
x <- rnorm(100)  
y <- rgamma(100, shape = exp(1 + 0.5*x), scale = 0.5) # 生成Gamma分布数据  
data <- data.frame(x, y)  
# 拟合Gamma广义线性模型  
model <- glm(y ~ x, family = Gamma) # 通常Gamma分布的链接函数是log  
# 查看模型摘要  
summary(model)  
# 进行预测  
predictions <- predict(model, newdata = data, type = "response")  
# 打印部分预测结果  
head(predictions)  
# 可视化拟合效果  
plot(y ~ x, data = data, main = "Gamma GLM Fit", xlab = "x", ylab = "y")  
lines(sort(x), predictions[order(x)], col = "red")

结果解读:

  1. 模型调用
    • glm(formula = y ~ x, family = Gamma) 表示使用了Gamma分布的广义线性模型来拟合y作为响应变量,x作为解释变量。
  2. 偏差残差
    • 这些残差是模型拟合后观察值与预测值之间的差异。它们被标准化以反映模型拟合的好坏。这里的范围从-1.8591到1.4717,说明模型在大多数点上都有较好的拟合,但也有一些较大的残差。
  3. 系数
    • (Intercept)的估计值为0.80267,标准误差为0.04969,t值为16.152,对应的p值小于2e-16,表明截距项在统计上是高度显著的。
    • x的估计值为-0.29239,标准误差为0.03379,t值为-8.654,对应的p值小于1e-13,表明xy有显著的负向影响。
  4. 显著性代码
    • 在系数表下方,***表示p值小于0.001,表明该系数在统计上高度显著。
  5. 分散参数
    • 对于Gamma分布,分散参数(Dispersion parameter)估计为0.3465648。在理想情况下,对于Gamma分布,这个值应该接近1,但这里小于1,可能意味着模型在某种程度上过度拟合了数据,或者数据的变异性小于Gamma分布通常假设的变异性。
  6. 偏差统计
    • Null deviance(空模型偏差)为58.242,基于99个自由度。这表示如果没有x变量,仅使用截距项时,模型的偏差。
    • Residual deviance(残差偏差)为36.953,基于98个自由度。这表示在加入x变量后,模型的偏差减少了,说明xy有解释作用。
  7. AIC
    • 赤池信息量准则(AIC)为224.92,用于比较不同模型的拟合优度。AIC值越小,模型拟合通常认为越好。
  8. Fisher评分迭代次数
    • 模型通过5次迭代达到收敛,这是算法寻找最佳参数估计值的迭代次数。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 对接开源大模型应用开发平台最佳实践
  • B3635 硬币问题
  • vue3 指定元素全屏 screenfull(可直接粘贴使用)
  • 【Python机器学习】循环神经网络(RNN)——对RNN进行预测
  • Ansible自动化部署kubernetes集群
  • PowerShell收集信息及绕过PowerShell权限
  • 使用Nignx打包前端项目
  • Java数据结构(十)——冒泡排序、快速排序
  • 22_图论中的高级数据结构
  • kubectl 命令介绍以及使用
  • 1.Linux常用指令大全
  • Android Activity分屏设置
  • 当 PLC 遇见 “IT”
  • 2024.9.11(k8s环境搭建)
  • 【电子通识】规格书上的%FS和%RD具体指什么?
  • 03Go 类型总结
  • 78. Subsets
  • android 一些 utils
  • es6(二):字符串的扩展
  • isset在php5.6-和php7.0+的一些差异
  • Javascript编码规范
  • leetcode讲解--894. All Possible Full Binary Trees
  • mysql 5.6 原生Online DDL解析
  • PhantomJS 安装
  • React的组件模式
  • TCP拥塞控制
  • vue学习系列(二)vue-cli
  • weex踩坑之旅第一弹 ~ 搭建具有入口文件的weex脚手架
  • 官方解决所有 npm 全局安装权限问题
  • 前嗅ForeSpider采集配置界面介绍
  • 世界编程语言排行榜2008年06月(ActionScript 挺进20强)
  • 手写一个CommonJS打包工具(一)
  • 7行Python代码的人脸识别
  • zabbix3.2监控linux磁盘IO
  • # Redis 入门到精通(九)-- 主从复制(1)
  • #我与Java虚拟机的故事#连载10: 如何在阿里、腾讯、百度、及字节跳动等公司面试中脱颖而出...
  • %@ page import=%的用法
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (2024.6.23)最新版MAVEN的安装和配置教程(超详细)
  • (PHP)设置修改 Apache 文件根目录 (Document Root)(转帖)
  • (Redis使用系列) Springboot 使用redis实现接口Api限流 十
  • (windows2012共享文件夹和防火墙设置
  • (附源码)springboot 个人网页的网站 毕业设计031623
  • (一一四)第九章编程练习
  • (总结)Linux下的暴力密码在线破解工具Hydra详解
  • (最全解法)输入一个整数,输出该数二进制表示中1的个数。
  • .NET C#版本和.NET版本以及VS版本的对应关系
  • .NET Standard、.NET Framework 、.NET Core三者的关系与区别?
  • .NET/ASP.NETMVC 深入剖析 Model元数据、HtmlHelper、自定义模板、模板的装饰者模式(二)...
  • .Net--CLS,CTS,CLI,BCL,FCL
  • .net反混淆脱壳工具de4dot的使用
  • @ModelAttribute使用详解
  • [145] 二叉树的后序遍历 js
  • [BJDCTF2020]EzPHP1
  • [BZOJ5125]小Q的书架(决策单调性+分治DP+树状数组)