当前位置: 首页 > news >正文

基因组学系列4:参考转录本数据库MANE

1. 参考转录本数据库MANE简介

为了促进临床参照的一致性,美国国家生物技术信息中心( NCBI)和欧洲分子生物学实验室-欧洲生物信息学研究所(EMBL-EBI)合作发布了参考转录本数据库MANE(Matched Annotation from the NCBI and EMBL-EBI),旨在汇集人类基因和转录本注释,并定义一组全基因组的代表性转录本和人类蛋白质编码基因的相应蛋白质。

MANE转录本与GRCh 38参考基因组组装完全匹配,并且是基于生物相关标准(例如转录本表达水平和编码区的保守性)进行选择的。

虽然NCBI的RefSeq 和 EMBL-EBI的Ensembl GENCODE注释具有相似性,但它们在转录水平上可能不同,代表特定剪接结构或编码序列的转录物可能从两个基因组之一缺失。此外,代表相同剪接结构的转录物可能在非翻译区(UTR)的长度上不同,或者由于SNP而具有序列错配。因此,研究人员使用偏好的基因集来设计研究和报告结果,可能会发现很难将他们的工作与科学界的其他人交流。数据资源,如基因组浏览器和变异数据库,也可能使用不同的注释集来表示默认转录本,这可能会导致混淆。NAME转录物在RefSeq和Ensembl/GENCODE注释集中是相同的,当在大多数公共基因组资源中表示时,预计将促进科学界之间更好的沟通和数据交换

NAME网址(提供NCBI和UCSC查看MANE推荐转录本示例):

https://www.ncbi.nlm.nih.gov/refseq/MANE/

2. MANE数据库的MANE select 和 MANE plus Clinical集

MANE的主要集有两个:MANE select 和 MANE plus Clinical;MANE(版本1.0)覆盖了99%的人类蛋白质编码基因和99.8%的临床相关基因。

MANE Select:

MANE Select集是由每个蛋白编码基因的一个代表性转录本组成,经计算机预测和专家组人工审核。该转录本通常作为临床报告的通用标准、基因组浏览器的默认配置等,作为临床报告的最终转录本编号。

MANE select选择流程

MANE Plus Clinical:

MANE Plus Clinical集合包括了一些基因的特殊转录本,考虑到某些基因会组织特异性表达,仅靠MANE Select就不足以报告公共资源中所有的“致病(P)”或“可能致病(LP)”临床变异,因此采用MANE Plus Clinical作为补充。

3. 基因与转录本关系

基因是指DNA上一段编码蛋白质或RNA的序列,而转录本则是从基因DNA序列转录成的RNA序列。一个基因若要发挥功能,需先转录为mRNA,进而转移到细胞质翻译成蛋白。转录过程中mRNA的加工(如选择性剪接、修饰等)可能会产生不同的可供编码蛋白质的成熟mRNA剪接体(即转录本)

一个基因可能会有多个转录本,产生原因包括可变剪切、启动子的选择性使用、选择性起始、核糖体移码等 。

1)选择性剪接(Alternative splicing)

真核生物的基因CDS序列包含内含子(intron)和外显子(exon),两者相互交替,仅外显子能够转录成mRNA。通过选择性剪接可以将同一基因中的外显子以不同方式进行组合,进而形成不同的蛋白质。

2)启动子的选择性使用(alternative promoter usage)

同一个基因可结合不同的启动子,使用不同的启动子产生不同的mRNA转录本,导致产生多种蛋白。

3)选择性起始(alternative initiation)

同一条mRNA中含有多个起始密码子,通常产生的蛋白序列仅在N端有差异。

4)核糖体移码(ribosomal frameshifting)

一种翻译重编码机制,导致核糖体改变其对密码子的读取(即从一个阅读框位移到另一个阅读框),产生不是由mRNA直接编码的蛋白质,或者两种甚至更多种不同的蛋白质。

不同转录本产生的原因中,选择性剪接是研究较早且被广泛认知的,选择性剪接作为发育和组织特异性的调节因子,在组织发育和细胞分化中发挥着重要的作用。

4. MANE文件下载

MANE地址: https://ftp.ncbi.nlm.nih.gov/refseq/MANE/

MANE

# linux下载
# 下载1.3版本 MANE gtf
wget https://ftp.ncbi.nlm.nih.gov/refseq/MANE/MANE_human/release_1.3/MANE.GRCh38.v1.3.ensembl_genomic.gtf.gz# 搜索BRCA1的第9号exon推荐转录本
zcat MANE.GRCh38.v1.3.ensembl_genomic.gtf.gz|grep BRCA1|grep 'exon_number 9'
# RefSeq:NM_007294.4

查询结果

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • java:实现简单的验证码功能
  • 【Solidity】继承
  • Django Signals
  • 【html+css 绚丽Loading】 - 000003 乾坤阴阳轮
  • 【算法/学习】双指针
  • 25考研计算机组成原理复习·3.5高速缓冲存储器
  • bootchart抓Android系统启动各阶段性能数据
  • 【微服务】Spring Cloud Alibaba 的介绍以及和主要功能
  • Type-C接口主要的几个功能引脚及功能
  • 【题目/训练】:双指针
  • 云主机部署 TiDB 测试集群
  • 景联文科技:一文详解如何构建高质量SFT数据
  • java基础03——Arrays.asList与ArrayList的区别(基本概念、用法、使用场景)
  • 24/8/17算法笔记 模仿学习算法
  • Spring中AbstractAutowireCapableBeanFactory
  • JS 中的深拷贝与浅拷贝
  • JS创建对象模式及其对象原型链探究(一):Object模式
  • JS基础之数据类型、对象、原型、原型链、继承
  • leetcode-27. Remove Element
  • MySQL用户中的%到底包不包括localhost?
  • PHP CLI应用的调试原理
  • Spark RDD学习: aggregate函数
  • 创建一种深思熟虑的文化
  • 翻译:Hystrix - How To Use
  • 官方解决所有 npm 全局安装权限问题
  • 基于Javascript, Springboot的管理系统报表查询页面代码设计
  • 讲清楚之javascript作用域
  • 力扣(LeetCode)22
  • 前端性能优化——回流与重绘
  • 思维导图—你不知道的JavaScript中卷
  • 文本多行溢出显示...之最后一行不到行尾的解决
  • 一起来学SpringBoot | 第十篇:使用Spring Cache集成Redis
  • 智能网联汽车信息安全
  • 阿里云重庆大学大数据训练营落地分享
  • 支付宝花15年解决的这个问题,顶得上做出十个支付宝 ...
  • ​​​​​​​STM32通过SPI硬件读写W25Q64
  • ​补​充​经​纬​恒​润​一​面​
  • ​探讨元宇宙和VR虚拟现实之间的区别​
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • #快捷键# 大学四年我常用的软件快捷键大全,教你成为电脑高手!!
  • (2024最新)CentOS 7上在线安装MySQL 5.7|喂饭级教程
  • (C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示
  • (CVPRW,2024)可学习的提示:遥感领域小样本语义分割
  • (PWM呼吸灯)合泰开发板HT66F2390-----点灯大师
  • (附源码)计算机毕业设计SSM智慧停车系统
  • (全部习题答案)研究生英语读写教程基础级教师用书PDF|| 研究生英语读写教程提高级教师用书PDF
  • (详细文档!)javaswing图书管理系统+mysql数据库
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (原創) 物件導向與老子思想 (OO)
  • (转)Linux整合apache和tomcat构建Web服务器
  • (转)winform之ListView
  • (转)四层和七层负载均衡的区别
  • (转)项目管理杂谈-我所期望的新人
  • ******之网络***——物理***
  • .Net CF下精确的计时器