当前位置: 首页 > news >正文

如何使用vcftools提取特定的染色体

起源是由于bam文件没有过滤完全,导致calling出来的vcf文件还有线粒体中的染色体存在,因为在金标准文件中只有1-22号和X染色体,不包含线粒体和Y染色体,因为我使用的金标准文件是来自NA12878,是一位白种人女性。因此,vcf文件需要进一步过滤。

1、使用vcftools软件提取特定染色体

要使用vcftools提取VCF文件中chr1染色体上的所有变异,需要遵循vcftools的命令行选项来指定输入文件、染色体编号以及输出文件的名称

如果你的VCF文件是压缩的(通常以.vcf.gz结尾),你可以使用--gzvcf选项;如果文件未压缩,则使用--vcf选项。

 vcftools --vcf bcftools.vcf --chr chr1 --recode --recode-INFO-all --out chr1_output

--recode告诉vcftools将筛选后的变异重新编码为VCF格式

--recode-INFO-all确保在输出文件中包含所有INFO字段的信息

--out chr1_output指定了输出文件的前缀(vcftools会自动添加.recode.vcf作为后缀来创建最终的VCF文件)。

图片

输出文件有以上这些。

图片

但是需要注意的是,--chr 后面是什么取决于你的vcf文件里CHROM这一列是什么命名的。

图片

我的bcftools.vcf头文件长这样

图片

还是挺快的

图片

最后我将chr1-22,和chrX染色体提取了出来

以.log结尾的都是日志文件

2、使用bcftools软件对多个vcf文件进行合并

一个常用的工具是bcftools concat(来自bcftools包,它是samtools的配套工具集),它专门用于合并多个VCF文件。

但是,请注意,在合并VCF文件之前,你需要确保这些文件在基因组位置上是兼容的(即它们应该覆盖相同的基因组区域或至少是互不重叠的),并且它们的INFO和FORMAT字段应该是一致的(或者至少是你想要合并的那些字段)。


bcftools concat -O v -o merged.vcf chr1_output.recode.vcf chr2.recode.vcf chr3.recode.vcf chr4.recode.vcf chr5.recode.vcf chr6.recode.vcf chr7.recode.vcf chr8.recode.vcf chr9.recode.vcf chr10.recode.vcf chr11.recode.vcf chr12.recode.vcf chr13.recode.vcf chr14.recode.vcf chr15.recode.vcf chr16.recode.vcf chr17.recode.vcf chr18.recode.vcf chr19.recode.vcf chr20.recode.vcf chr21.recode.vcf chr22.recode.vcf chrX.recode.vcf

输出文件为

图片

图片

  • bcftools concat 是用于合并VCF文件的命令。

  • -O v来明确指定输出格式为VCF,这是默认设置

  • -Oz 选项指定输出文件应该被压缩(使用gzip),并且输出格式为VCF(默认是BCF,但VCF也受支持,尽管没有特定的选项来明确指定)。

  • -o merged.vcf.gz 指定输出文件的名称。

  • 后面跟着的是要合并的VCF文件列表

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • idea付费插件,SequenceDiagram有哪些优点
  • 第三章 数组(3)
  • 看github源码必备的chrome插件
  • 瀑布流布局 vue
  • 数据源10min自动断开连接导致查询抛异常(未获取可用连接)
  • Fast-BEV: A Fast and Strong Bird’s-Eye ViewPerception Baseline
  • 安防视频汇聚平台EasyCVR启动后无法访问登录页面是什么原因?
  • Unity | 基础知识
  • 深入理解并实现——归并排序【C语言】
  • 学生用什么类型投影仪比较好?2024开学季最值得买的装备当贝X5S投影仪
  • 10:USB模块布局
  • STM32H750VBT6烧录源码无反应的问题
  • 应用层(Web与HTTP)
  • docker基本使用及常见问题
  • 零基础入门天池镜像提交--windows场景VirtualBox虚拟机安装linux系统并ssh远程登录,直至镜像的制作及提交
  • @jsonView过滤属性
  • CSS中外联样式表代表的含义
  • C学习-枚举(九)
  • Django 博客开发教程 8 - 博客文章详情页
  • Git初体验
  • Git的一些常用操作
  • laravel5.5 视图共享数据
  • LintCode 31. partitionArray 数组划分
  • Linux gpio口使用方法
  • mysql常用命令汇总
  • Mysql优化
  • SQLServer之创建数据库快照
  • Stream流与Lambda表达式(三) 静态工厂类Collectors
  • Transformer-XL: Unleashing the Potential of Attention Models
  • Vue2.0 实现互斥
  • 编写高质量JavaScript代码之并发
  • 仿天猫超市收藏抛物线动画工具库
  • 搞机器学习要哪些技能
  • 基于Volley网络库实现加载多种网络图片(包括GIF动态图片、圆形图片、普通图片)...
  • 开发了一款写作软件(OSX,Windows),附带Electron开发指南
  • 理解在java “”i=i++;”所发生的事情
  • 目录与文件属性:编写ls
  • 浅谈Golang中select的用法
  • 使用 @font-face
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 微信开放平台全网发布【失败】的几点排查方法
  • 微信小程序上拉加载:onReachBottom详解+设置触发距离
  • 为视图添加丝滑的水波纹
  • RDS-Mysql 物理备份恢复到本地数据库上
  • ​1:1公有云能力整体输出,腾讯云“七剑”下云端
  • #QT(TCP网络编程-服务端)
  • $redis-setphp_redis Set命令,php操作Redis Set函数介绍
  • (70min)字节暑假实习二面(已挂)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (MTK)java文件添加简单接口并配置相应的SELinux avc 权限笔记2
  • (第二周)效能测试
  • (精确度,召回率,真阳性,假阳性)ACC、敏感性、特异性等 ROC指标
  • (三) diretfbrc详解
  • (三十)Flask之wtforms库【剖析源码上篇】
  • (五) 一起学 Unix 环境高级编程 (APUE) 之 进程环境