当前位置: 首页 > news >正文

临床预测之logictic回归 1-2

经典Logistic回归:原理、计算步骤以及应用

多重线性回归模型要求因变量是连续型的正态分布变量,且自变量与因变量呈线性关系**。当因变量是分类变量,且自变量与因变量不呈线性关系时**,就不能确足多重线性回归模型的适用条件。此时,处理该类资料常用Logistic回归模型。Logistic回归分析属于非线性回归,它是研究因变量为二项分类或多项分类结果与某些影响因素之间关系的一种多重回归分析方法。

在疾病的病因学研究中,经常需要分析疾病的发生与各危险因素之间的定量关系。比如,研究食管癌的发生与吸烟、饮酒、不良饮食习惯等危险因素的关系。如果采用多重线性回归分析,由于因变量y为二分类变量(通常取值0或1),不满足正态分布和方差齐等应用条件,若强行使用线性回归分析,其预测值可能会大于1或小于,而无法解释。在流行病学研究中,虽然可以用Mantel-Haenszel分层分析方法分析多个因素的混杂作用,但这种经典方法有其局限性,随着混杂因素的增加,分层越来越细,致使每层内的数据越来越少,使相对危险度的估计产生困难。Logistic回归模型较好地解决了上述问题,已经成为医学研究,特别是流行病学病因研究中最常用的分析方法之一。

概述 logistic 回归预测模型,三步骤 视频链接

首先制备数据,然后三步走

1.模型构建
2.模型评价
3.模型验证

模型构建的问题:

a.变量帅选问题,这么多变量,到底谁的影响大呢,应该选择哪些变量呢
# ### ##########方法一 常规 先单后多
###############方法二 非常规 协变量晒选()
###############方法三 其他方法

在这里插入图片描述
为什么需要模型评价呢
在这里插入图片描述
模型验证 可以外部验证 也可内部验证
在这里插入图片描述
总结
在这里插入图片描述

下面正式进入第一步 变量的筛选:先单后多

在这里插入图片描述

data 数据详解 首先要了解自己的变量类型 并且做好分类

因变量:

分组, 1 表示PE(发生肺动脉栓塞)  0 表示control(未发生肺动脉栓塞)

在这里插入图片描述

把所有的变量处理成因子

的

处理之后的data如下图

在这里插入图片描述
利用函数 了解一下自己的数据

在这里插入图片描述
在这里插入图片描述

确定变量类型是否正确 str() 函数

在这里插入图片描述
数据准备好了,
那么接下来进行模型构建 ###方法一:先单后多

在这里插入图片描述

这里已经制备了
x1  把连续自变量都放在叫做x1的向量内 
x2  把分类自变量都放在叫做x2的向量内 

这里先做 t检验 卡方检验 秩序检验 对每个自变量都进行一次显著性分析 获得那些具有显著性的因素(即挑选出符合p小于0.05的单因素),然后用于之后的多因素分析

factorVars 指定所有的分类变量
strate  指定需要分析的组别:这里 分组 代表 是否发生肺动脉高压
addverall参数表示 是否显示 overall组

在这里插入图片描述
结果解读:主要看test列的p值 是否小于0.05
在这里插入图片描述

补充:
在这里插入图片描述

在进行上述的各种显著性检验之后,发现所有因素都会 显著性影响是否发生肺动脉高压,那么现在我们对这些因素进行 逐个的单因素logistic回归分析

连续变量

首先进行 年龄的单因素logistic回归分析 以及结果解读

在这里插入图片描述
结果解读
在这里插入图片描述
在这里插入图片描述

bmi指数  单因素 logistic 回归分析

在这里插入图片描述
结果解读
在这里插入图片描述

分类变量

术前下肢静脉彩超 单变量 logistic 回归分析

结果解读

在这里插入图片描述
EKG 分类变量 单因素分析 结果解读
在这里插入图片描述

以上结果表明 这些因素都与是否发生肺动脉 显著相关 那么都纳入接下来的多因素回归分析

多因素回归分析

使用函数glm()

在这里插入图片描述
多因素回归分析 结果解读
这样就可排除一些在单因素分析时 的一些因素,结果发现之后4个因素有显著性差异
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

小结一下 总结:

多因素logistic回归 最终发现了四个因素 显著性影响是否发生肺动脉高压

那么这种简单粗暴的 多因素逻辑回归有没有可能漏掉了一些 协变量呢

下面进入 非常规 多因素logistic 回归 非常规 先单后多

在这里插入图片描述

首先自建函数:判断一个协变量是否应该纳入多因素分析
1 首先进行糖抗原的单因素回归,求得回归系数coef
2 然后对糖抗原和其他任意协变量进行回归分析, 求得回归系数coef2
3 判断coef2与coef的变化是否超过10%,如果超过10%,则把该协变量取出
在这里插入图片描述
然后运行代码
在这里插入图片描述
结果显示:得到年龄和 术前下肢静脉彩超 两个因素可以作为 糖抗原ca513的协变量
在这里插入图片描述
利用找到的协变量 进行logistic多因素分析

glm()函数

在这里插入图片描述
结果解读
在这里插入图片描述

相关文章:

  • 计算机学院第一周语法组及算法组作业
  • 【Pandas 数据分析 1】快速入门
  • Python中计算程序的运行时间——timeit模块
  • 第十三届蓝桥杯JavaB组省赛——最大子矩阵 (AC)
  • 【CMake】第2篇 CMake构建.h与.cpp文件
  • Kmeans
  • 【C++】C++11的那些新特性
  • 【数据结构 | 入门】线性表与链表 (问题引入实现算法优化)
  • vmware虚拟机中的archlinux无法播放声间的解决办法
  • 深度学习常用的backbone有哪些
  • 君正X2000/X1600主控CPU方案有哪些场景?行业迈向人机交互智能时代来啦!
  • c++类和对象万字详解
  • Less预处理——初识Less
  • 在低浓度下修饰生物分子的Pyrimidine-Tetrazine-PEG1-Alkyne 四嗪试剂
  • 【web前端开发】前端生日礼物--主页面篇
  • 【162天】黑马程序员27天视频学习笔记【Day02-上】
  • Apache Spark Streaming 使用实例
  • javascript面向对象之创建对象
  • Laravel5.4 Queues队列学习
  • LeetCode18.四数之和 JavaScript
  • React组件设计模式(一)
  • TCP拥塞控制
  • Terraform入门 - 1. 安装Terraform
  • XML已死 ?
  • 对话:中国为什么有前途/ 写给中国的经济学
  • 记一次和乔布斯合作最难忘的经历
  • 前端临床手札——文件上传
  • 协程
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • #### go map 底层结构 ####
  • #stm32整理(一)flash读写
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (Demo分享)利用原生JavaScript-随机数-实现做一个烟花案例
  • (Spark3.2.0)Spark SQL 初探: 使用大数据分析2000万KF数据
  • (二)windows配置JDK环境
  • (规划)24届春招和25届暑假实习路线准备规划
  • (转) 深度模型优化性能 调参
  • (轉貼) 蒼井そら挑戰筋肉擂台 (Misc)
  • .net 反编译_.net反编译的相关问题
  • .NET 事件模型教程(二)
  • .Net 知识杂记
  • .NET/C# 检测电脑上安装的 .NET Framework 的版本
  • .Net7 环境安装配置
  • .NET开源全面方便的第三方登录组件集合 - MrHuo.OAuth
  • .NET开源项目介绍及资源推荐:数据持久层 (微软MVP写作)
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • .Net面试题4
  • .NET微信公众号开发-2.0创建自定义菜单
  • /deep/和 >>>以及 ::v-deep 三者的区别
  • @private @protected @public
  • @RequestBody的使用
  • [Android]How to use FFmpeg to decode Android f...
  • [C#]winform利用seetaface6实现C#人脸检测活体检测口罩检测年龄预测性别判断眼睛状态检测
  • [C++打怪升级]--学习总目录
  • [C语言]——内存函数