当前位置: 首页 > news >正文

医学数据分析实训 项目一 医学数据采集

项目一 医学数据采集

一、实践目的

  1. 了解医学数据的特点;
  2. 熟悉常见的医学公共数据库的使用方法;
  3. 掌握获取医学数据的方法;

二、实践平台

  1. 操作系统:Windows10 及以上
  2. Python 版本:3.8.x 及以上
  3. PyCharm 或 Anoconda 集成环境

三、实践内容

医学数据采集实验的数据来源广泛,主要包括以下几个方面:

  • 患者数据:通过电子病历系统、患者自主记录等方式收集患者的临床症状、体征、病史、用药情况等信息;
  • 医疗设备数据:利用各种医疗设备(如心电图机、超声仪、CT 扫描仪等)实时监测患者的生理参数和健康状况,生成大量医学图像和数据;
  • 实验室数据:通过实验室检测获取患者的生化指标、遗传学信息、微生物学结果等数据;
  • 外部数据源:包括公共卫生数据库、医学研究数据库等,这些数据库包含了大量的医学研究成果和临床数据,为医学数据采集实验提供了丰富的资源。

1. 熟悉常见医学公共数据库的使用方法

(1)熟悉 Kaplan-Meier Plotter 平台 https://kmplot.com/analysis/ 的使用
  • 操作过程
    • 访问 Kaplan-Meier Plotter 平台首页(图 1)。
      在这里插入图片描述

    • 输入对应参数(图 2),如基因 STAT2 和乳腺癌生存率的相关性。

    • 在这里插入图片描述

    • 生成生存率关系图(图 3),并通过文字对结果进行解释。

    • 在这里插入图片描述
      在这里插入图片描述

解释含义:(fitten code生成)

1 高表达STAT2基因的乳腺癌患者群体的生存率显著高于低表达

2 体这种差异在统计学上是显著的(Log-rank P值为9e-11)

3 STAT2基因的高表达可能与乳腺癌患者更好的生存率相关

(2)熟悉 SEER 数据库 https://seer.cancer.gov/data-software/ 的使用方法
  • 操作过程
    • 在 SEER 数据库中查询癌症数据。

    • 在这里插入图片描述
      在这里插入图片描述

    • 对查询结果(图 4)进行解释。

    • 在这里插入图片描述

解释含义:(fitten code生成)

1 从2000年到2021年,男性和女性的癌症发病率总体上保持稳定,没有显著的变化

2 男性和女性的发病率在2000年至2017年间没有显著的年度百分比变化

3 这张图表明,在2000年至2021年期间,所有癌症部位的年龄调整发病率在男性和女性中都没有显著变化

2. 使用 GEO 数据库 https://www.ncbi.nlm.nih.gov/geo 下载数据集

  • 操作步骤

    • 访问 GEO 页面(图 5)。

    • 在这里插入图片描述

    • 在 GEO 中检索肝癌(HCC)环状 RNA(circRNA)研究数据(图 6)。

    • 在这里插入图片描述

    • 选择并查看检索到的数据集(图 7)。

    • 在这里插入图片描述

    • 查看数据集的详细信息(图 8)。

    • 在这里插入图片描述

    • 下载数据集(图 9)。

    • 在这里插入图片描述

  • 查看下载的数据集文件(图 10),并对该数据集进行解释。

解释含义:(fitten code生成)

在GEO(Gene Expression Omnibus)数据库中,"ID_REF"通常表示基因或探针的标识符。在你提供的数据集中,"ID_REF"后面的数据是基因或探针的表达值,这些值对应于不同的样本(GSM编号)。
这是一个关于肝癌(HCC)环状RNA(circRNA)研究的表达矩阵。每一行代表一个特定的circRNA(由"ID_REF"标识),每一列代表一个样本(由GSM编号标识)。矩阵中的数值表示相应circRNA在相应样本中的表达水平。
例如,第一行数据:

“ASCRP000002” 9.042573151 9.238902276 8.997313248 9.4371723 8.962706649 9.415486133 9.017848355 9.524889458 9.671877122 9.479558558 9.227469787 9.409693079 8.97187312 8.96956744
CopyInsert
表示circRNA "ASCRP000002"在14个不同样本中的表达值。这些值可以用来分析circRNA在不同样本中的表达差异,从而研究其在肝癌发生发展中的作用。

3. 通过 UCI 机器学习库下载数据集

  • 操作步骤
    • 访问 UCI 机器学习库官网(https://archive.ics.uci.edu/ )。

    • 在这里插入图片描述

    • 在数据集中搜索并下载任意两个与医药卫生相关的数据集。

    • 一个是心脏病数据集,另一个是乳腺癌数据集。download the datasets.

    • 在这里插入图片描述

    • 在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述

在这里插入图片描述

  • 通过文字对数据集进行解释。

解释含义:(fitten code生成)

  • 这个打开数据集,自己看吧。这里举一个例子
  • 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
- 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 深入解读Docker核心原理:Namespace资源隔离机制详解
  • SPDK 部署NVMe over TCP
  • golang学习笔记19——golang做服务发现与注册的深度剖析
  • PHP在现代Web开发中的高效应用与最佳实践
  • 【C++】模拟实现string类
  • LabVIEW重构其他语言开发的旧系统
  • 个人hic分析流程搭建4—compartment模块分析
  • 切线空间:unity中shader切线空间,切线矩阵,TBN矩阵 ,法线贴图深度剖析
  • 基于人工智能的自动驾驶系统项目教学指南
  • 三星ZFlip5/ZFlip4/W7024刷安卓14国行OneUI6.1系统-高级设置-韩/欧/港版
  • StreamReader 和 StreamWriter提供自动处理字符编码的功能
  • AI+摄影:行业变革与创新机遇
  • 建筑工程资料保护策略:打造安全的建筑文档管理方案
  • 【数据结构精讲】01绪论(基本概念介绍和时间复杂度计算)
  • 【Android安全】Ubuntu 16.04安装GDB和GEF
  • 【跃迁之路】【733天】程序员高效学习方法论探索系列(实验阶段490-2019.2.23)...
  • Angular 响应式表单 基础例子
  • canvas绘制圆角头像
  • es的写入过程
  • fetch 从初识到应用
  • Laravel Telescope:优雅的应用调试工具
  • MyEclipse 8.0 GA 搭建 Struts2 + Spring2 + Hibernate3 (测试)
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • react 代码优化(一) ——事件处理
  • SegmentFault 社区上线小程序开发频道,助力小程序开发者生态
  • Web设计流程优化:网页效果图设计新思路
  • 翻译 | 老司机带你秒懂内存管理 - 第一部(共三部)
  • 排序(1):冒泡排序
  • 手机app有了短信验证码还有没必要有图片验证码?
  • 微信开源mars源码分析1—上层samples分析
  • 一个JAVA程序员成长之路分享
  • 一些css基础学习笔记
  • 一些基于React、Vue、Node.js、MongoDB技术栈的实践项目
  • 原生js练习题---第五课
  • 正则表达式小结
  • #Linux(make工具和makefile文件以及makefile语法)
  • $forceUpdate()函数
  • (0)Nginx 功能特性
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (web自动化测试+python)1
  • (创新)基于VMD-CNN-BiLSTM的电力负荷预测—代码+数据
  • (附源码)计算机毕业设计SSM基于java的云顶博客系统
  • (过滤器)Filter和(监听器)listener
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (转)fock函数详解
  • (转载)微软数据挖掘算法:Microsoft 时序算法(5)
  • (轉貼)《OOD启思录》:61条面向对象设计的经验原则 (OO)
  • ./include/caffe/util/cudnn.hpp: In function ‘const char* cudnnGetErrorString(cudnnStatus_t)’: ./incl
  • .NET NPOI导出Excel详解
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • .NET6实现破解Modbus poll点表配置文件
  • .net和jar包windows服务部署
  • .net利用SQLBulkCopy进行数据库之间的大批量数据传递
  • .net与java建立WebService再互相调用
  • @font-face 用字体画图标