当前位置: 首页 > news >正文

10.windows ubuntu 组装软件:spades,megahit

      Spades 是一种用于组装测序数据的软件,特别适用于处理 Illumina 测序平台产生的数据。它的全称是 "St. Petersburg genome assembler",是一款广泛使用的基因组组装工具。 

第一种:wget https://cab.spbu.ru/files/release3.15.3/SPAdes-3.15.3-Linux.tar.gz #下载SPAdes
tar -zxvf SPAdes-3.15.3-Linux.tar.gz

添加环境变量到~/.bashrc

第二种方法:conda install -c bioconda spades -y

#spades.py基础应用
spades.py -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz -o out -t 20 --isolate  #需要把输出目录清空,否则会报错 

#一些参数的含义。

-1, --pe1-1: 包含第一对端(pair-end)测序数据的文件。

-2, --pe1-2: 包含第二对端(pair-end)测序数据的文件。

--s1: 包含单端测序数据的文件。

-o, --output: 指定输出目录的路径。

-t, --threads: 指定要使用的线程数。

--meta: 指示 Spades 使用元基因组学模式进行组装。

--plasmid: 指示 Spades 寻找和组装质粒DNA序列。

--careful: 启用谨慎模式,以提高组装的准确性。

--only-assembler: 只运行组装步骤,而不运行错误矫正。

--cov-cutoff: 根据覆盖度进行组装的最低值。

-k :kmer数,一次可以输入多个,用逗号分隔,数值从小到大排列,kmer最大为127,数值必须是奇数,一般自动选择即可,--sc 参数,则默认值为 21,33,55 。若没有 --sc 参数,则程序会根据 reads 长度自动选择 k-mer 参数

--plasmid:从WGS数据集组装质粒

--metaplasmid:从宏基因组组装体中提取染色体外元素,如质粒

#megahit安装

conda install -c bioconda megahit -y

#基础使用

sudo /home/guozihan/miniconda3/envs/spades_env/bin/python /home/guozihan/miniconda3/envs/spades_env/bin/megahit -1 read_hont_removed_1.fastq.gz -2 read_hont_removed_2.fastq.gz --num-cpu-threads 20 --out-dir megahit_out --tmp-dir /tmp --out-prefix A1

#使用中遇到三个问题,1.--out-dir 输出路径需要目录不存在任何内容。2.--tmp-dir 临时文件保留路径在ubuntu中好像只能设/tmp路径,设置其它路径,否则会报错没有操作权限。3.要指定python程序的路径,要用根用户权限,即sudo /home/guozihan/miniconda3/envs/spades_env/bin/python。

#命令行各参数的作用

sudo: 在Linux系统中,sudo命令用于以超级用户或其他用户的身份运行命令。以超级用户权限运行命令可能需要输入密码进行确认。

/home/guozihan/miniconda3/envs/spades_env/bin/python: 指定要使用的 Python 解释器的路径,用于执行 Megahit 软件。

/home/guozihan/miniconda3/envs/spades_env/bin/megahit: 指定要执行的 Megahit 可执行文件的路径。

-1 read_hont_removed_1.fastq.gz: 指定包含第一端测序数据的 fastq 文件。

-2 read_hont_removed_2.fastq.gz: 指定包含第二端测序数据的 fastq 文件。

--num-cpu-threads 20: 指定要使用的CPU线程数,这里设置为 20 个线程,用于加速程序运行。

--out-dir megahit_out: 指定输出结果的目录,Megahit 运行后生成的结果文件将保存在该目录中。

--tmp-dir /tmp: 指定临时文件存储的目录,Megahit 运行过程中生成的临时文件将保存在该目录中。

--out-prefix A1: 指定输出文件的前缀,生成的汇总文件和结果文件会以该前缀开头命名。

相关文章:

  • 鸿蒙应用开发-录音保存并播放音频
  • Linux文件(系统)IO(含动静态库的链接操作)
  • 最新2024年增强现实(AR)营销指南(完整版)
  • 全国青少年软件编程(Python)等级考试一级考试真题2023年9月——持续更新.....
  • HTML块级元素和内联元素(头部和布局)
  • centos 7 安装磐维(PanWeiDB)数据库(单机)
  • pandas在循环中多次写入数据到一个excel防止锁定的方法
  • 鸿蒙ARKTS--简易的购物网站
  • 【pytest、playwright】多账号同时操作
  • 基于spark的大数据分析预测地震受灾情况的系统设计
  • 【洛谷】P9241 [蓝桥杯 2023 省 B] 飞机降落
  • OpemMP 同步结构
  • React Hooks的出现解决了什么问题?
  • 手写简易操作系统(十七)--编写键盘驱动
  • vue2 配置vue.config.js devServer 时报错
  • $translatePartialLoader加载失败及解决方式
  • (三)从jvm层面了解线程的启动和停止
  • __proto__ 和 prototype的关系
  • 【MySQL经典案例分析】 Waiting for table metadata lock
  • 2019.2.20 c++ 知识梳理
  • Angular数据绑定机制
  • Fabric架构演变之路
  • Facebook AccountKit 接入的坑点
  • Hibernate【inverse和cascade属性】知识要点
  • java8 Stream Pipelines 浅析
  • java中具有继承关系的类及其对象初始化顺序
  • React系列之 Redux 架构模式
  • Tornado学习笔记(1)
  • Vue官网教程学习过程中值得记录的一些事情
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 彻底搞懂浏览器Event-loop
  • 基于HAProxy的高性能缓存服务器nuster
  • 基于OpenResty的Lua Web框架lor0.0.2预览版发布
  • 物联网链路协议
  • 小试R空间处理新库sf
  • C# - 为值类型重定义相等性
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • ​​​​​​​ubuntu16.04 fastreid训练过程
  • $L^p$ 调和函数恒为零
  • (Java实习生)每日10道面试题打卡——JavaWeb篇
  • (Redis使用系列) Springboot 实现Redis 同数据源动态切换db 八
  • (分享)自己整理的一些简单awk实用语句
  • (力扣记录)1448. 统计二叉树中好节点的数目
  • (三) prometheus + grafana + alertmanager 配置Redis监控
  • (四)Linux Shell编程——输入输出重定向
  • (一一四)第九章编程练习
  • (轉貼) 蒼井そら挑戰筋肉擂台 (Misc)
  • .NET开发不可不知、不可不用的辅助类(三)(报表导出---终结版)
  • .NET牛人应该知道些什么(2):中级.NET开发人员
  • @Autowired注解的实现原理
  • @cacheable 是否缓存成功_Spring Cache缓存注解
  • @DataRedisTest测试redis从未如此丝滑
  • [ 蓝桥杯Web真题 ]-Markdown 文档解析
  • [] 与 [[]], -gt 与 > 的比较
  • [04]Web前端进阶—JS伪数组