Multiqc(转录组分析之质量评估)
fastqc是一款基于java的软件,能够对测序数据的质量进行评估。一个样本生成一个报告,当样本量过多时,逐一查看样本质量就稍显不方便,multiqc是一个基于Python的模块, 用于整合其它软件的报告的软件,能将fastqc生成的多个报告整合成一个报告的软件,这样能方便的查看所有测序数据的质量。目前支持以下软件结果的整合:
作者:stanford_strive
链接:https://www.jianshu.com/p/85da4dcc6020
来源:简书
Pre-alignment tools
Alignment tools
Post-alignment tools
multiqc的安装:
在已经安装Anaconda的情况下,安装MultiQC非常简单,直接在shell命令面板中输入以下命令:
conda install -c biocondamultiqc
multiqc的使用和常用参数:
Usage: multiqc[OPTIONS] <analysis directory>
Options:
-f, --force 重写已存在的报告
-s, --fullnames 保留样本名称
-o, --outdir TEXT 报告输出路径
-l, --file-list 提供包含搜索路径列表的文档(每行一个)
-z, --zip-data-dir 压缩数据目录
-p, --export 将报告中的图导出为静态图
-fp, --flat 只使用平面图(静态图)
-ip, --interactive 只使用动图(HighCharts Javascript)
--pdf 输出PDF格式的报告(需要安装Pandoc)
现在用最简单的命令整合fastqc的报告:
(multiqc+fastqc结果报告存放路径+multiqc报告输出路径)
> multiqc /data/home/chj/fastqc_result -o/data/home/chj/multiqc_result
命令执行完毕会生成1个html报告,直接网页打开就可以查看和一个multiqc_data的文件夹,其中包含一些数据基本的统计信息和日志文档。
multiqc整合的fastqc的报告包含以下几个部分:
1 General Statistics:所有样本数据基本情况统计
%Dups——重复reads的比例
%GC——GC含量占总碱基的比例,比例越小越好
Length——测序长度
M Seqs——总测序量(单位:millions)
2 Sequence Quality Histograms:每个read
作者:stanford_strive
链接:https://www.jianshu.com/p/85da4dcc6020
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。