当前位置: 首页 > news >正文

序列比对 hisat2

转录组入门(5):序列比对
任务列表
比对软件
hisat2的用法
下载index文件
比对、排序、索引
质量控制
载入IGV,截图几个基因
hisat2的用法
本作业是比对到基因组,所以使用gapped or splices mapper,此流程已经更新。TopHat首次被发表已经是7年前,STAR的比对速度是TopHat的50倍,HISAT更是STAR的1.2倍。HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2。
官网:https://ccb.jhu.edu/software/hisat2/index.shtml(学习一个软件最好的方法就是结合现有中文资料,加上阅读官方说明书和HELP文档,一般刚开始学习的时候先使用默认参数,不要乱调参数)
下载index文件
1
2
3
4
5
6
cd ~/reference
mkdir -p index/hisat && cd index/hisat
wget -c ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz
wget -c ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/mm10.tar.gz
tar zxvf hg19.tar.gz
tar xvzf mm10.tar.gz
-c:断点续传
比对、排序、索引
把fastq格式的reads比对上去得到sam文件,接着用samtools把它转为bam文件,并且排序(注意N和P两种排序区别)索引好(可以使用管道实现,省去中间SAM保存的过程,直接输出BAM文件)
编写bash脚本:map.sh
1
2
3
4
5
6
7
8
9
10
11
12
#! usr/bin/bash
set -u
set -e
set -o pipefail
hg19_ref=/mnt/hgfs/2017/reference/index/hisat/hg19/genome
mm10_ref=/mnt/hgfs/2017/reference/index/hisat/mm10/genome
data_path=/mnt/hgfs/2017/rna_seq/data
NUM_THREADS=25
ls --color=never Homo1.fastq.gz | while read id;do(~/biosoft/hisat2-2.1.0/hisat2 -t -p $NUM_THREADS -x $hg19_ref -1 d a t a p a t h / data_path/ datapath/{id%_}1.fastq.gz -2 d a t a p a t h / data_path/ datapath/{id%}2.fastq.gz 2 > ${id%}map.log | samtools view -Sb - > ${id%}.bam);done
ls --color=never Mus
1.fastq.gz | while read id;do(~/biosoft/hisat2-2.1.0/hisat2 -t -p $NUM_THREADS -x $mm10_ref -1 d a t a p a t h / data_path/ datapath/{id%_}1.fastq.gz -2 d a t a p a t h / data_path/ datapath/{id%}2.fastq.gz 2 > ${id%}map.log | samtools view -Sb - > ${id%}.bam);done
ls --color=never .bam | while read id;do(samtools sort --threads $NUM_THREADS $id -o ${id%.}_sorted.bam);done
ls --color=never *_sorted.bam | while read id;do(samtools index $id);done
运行脚本:
1
bash map.sh
质量控制
对bam文件进行简单QC
Reads比对后的质量控制(评估比对质量的指标)
比对上的reads占总reads的百分比;
Reads比对到外显子和参考链上的覆盖度是否一致;
比对到基因组序列,多重比对reads;
相关质控软件除了Picard,RSeQC,Qualimap还有一大堆

相关文章:

  • java 多线程 安全 源码_Java多线程理解:线程安全的集合对象
  • dir file list.file list.dirs
  • 后缀是php,怎么修改php后缀
  • inurl faq.php,使用 PHP
  • r语言中六种方法查看R函数源代码—— 鼠标放在函数上,按下F2
  • php mysqli_affected_rows(),Mysqli_num_rows与PHP中mysqli_affected_rows的区别
  • R语言字符串替换:gsub()
  • matlab实现数据压缩,【Matlab】Huffman编码如何实现数据压缩
  • getcurrenttime java,getcurrenttime
  • java nio netty 教程,4. 彤哥说netty系列之Java NIO实现群聊(自己跟自己聊上瘾了),netty实现...
  • java ucs 2,【字符编码系列】JavaScript使用的编码-UCS-2
  • R语言-文件管理系统操作 list.files dir.file dir
  • metaweblog php,.NET_在Asp.Net中创建MetaWeblog API, 概念   metaweblog是基于XML - phpStudy...
  • php android okgo上传图片,Android OkHttp的封装类OkGo的用法
  • find与xargs连用复制移动位置
  • CentOS6 编译安装 redis-3.2.3
  • CSS 提示工具(Tooltip)
  • iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码
  • iOS小技巧之UIImagePickerController实现头像选择
  • Java-详解HashMap
  • mysql外键的使用
  • passportjs 源码分析
  • php ci框架整合银盛支付
  • Python 使用 Tornado 框架实现 WebHook 自动部署 Git 项目
  • Python_网络编程
  • 百度小程序遇到的问题
  • 聚类分析——Kmeans
  • 力扣(LeetCode)56
  • 聊聊redis的数据结构的应用
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 悄悄地说一个bug
  • 树莓派 - 使用须知
  • 我与Jetbrains的这些年
  • 找一份好的前端工作,起点很重要
  • 正则表达式
  • 仓管云——企业云erp功能有哪些?
  • 函数计算新功能-----支持C#函数
  • 移动端高清、多屏适配方案
  • ​【已解决】npm install​卡主不动的情况
  • $forceUpdate()函数
  • (007)XHTML文档之标题——h1~h6
  • (翻译)terry crowley: 写给程序员
  • (附源码)springboot宠物医疗服务网站 毕业设计688413
  • (附源码)ssm码农论坛 毕业设计 231126
  • (十二)python网络爬虫(理论+实战)——实战:使用BeautfulSoup解析baidu热搜新闻数据
  • .h头文件 .lib动态链接库文件 .dll 动态链接库
  • .NET 设计一套高性能的弱事件机制
  • .net 使用ajax控件后如何调用前端脚本
  • .NET 中 GetHashCode 的哈希值有多大概率会相同(哈希碰撞)
  • .NET/C# 项目如何优雅地设置条件编译符号?
  • .Net6使用WebSocket与前端进行通信
  • /bin/bash^M: bad interpreter: No such file ordirectory
  • @DataRedisTest测试redis从未如此丝滑
  • @四年级家长,这条香港优才计划+华侨生联考捷径,一定要看!
  • [ 环境搭建篇 ] 安装 java 环境并配置环境变量(附 JDK1.8 安装包)