当前位置: 首页 > news >正文

SRA下载到分析

SRA下载到分析

SRA获取方式

你上面说的那么重要,怎么获取呢?
SRA数据你可以理解为测序fastq文件的压缩
测序fastq文件很大,至少也有5G左右,双端测序,加起来一个样本也要8G左右,SRA就是压缩这么大的文件至2~3G。下载速度越快获得数据越完整,心情越舒畅。("别废话,赶紧说下载!"~"好的“)
下载的东西哪里去找呢
https://www.ncbi.nlm.nih.gov/sra?term=SRP074349
你在GEO上面找到了你想要的高通量数据,按照下面的步骤你会得到你要的文件名称是啥~~~~


下载方式一:FTP下载 https://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR347/SRR3474721/
用任意浏览器,推荐火狐,打开这个网址,如图点击就自动下载了。
如果网速足够快,比如平时下个小电影速度是50~100Mbp/s,用这种方法就可以了,但记住得一个一个下。
上面的那种下载速度在国内不是普遍的,我们一般都是1~5Mbp/s这个级别的,
下载方式二:神器~Aspera Connect 浏览器插件
这个神器是IBM公司出品的一个免费的,不知道什么原理的神器,他能让下载速度保持在50~100Mbp/s。也就是说打破了带宽和地域的限制。
这里要说明一下,以前你可以下载Aspera connect软件。它能嵌入到浏览器中,当浏览带有高速下载内容网址直接点击就好了。
例如NCBI的
https://www.ncbi.nlm.nih.gov/projects/faspftp/1000genomes/
以前SRA还是能够从这里下载的,现在不知道为什么这个口被关了,可能是跟政府没钱了有关系吧。
下载方式三:神器Too~Aspera Connect
对的还是这个东西,只不过是在linux的系统中采用命令行的方法去下载。
所以, 首先你得有个带有Linux的电脑或者服务器
电脑么,去搞个虚拟机,装个linux
服务器么,去搞个云服务器,怎么搞看下面的教程

生信干货~搞定一台便宜的云服务器​mp.weixin.qq.com


然后,安装与配置环境
下载:
wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727-linux-64.tar.gz
解压:
tar zxvf aspera-connect-3.7.4.147727-linux-64.tar.gz
安装
bash aspera-connect-3.7.4.147727-linux-64.sh
查看是否有.aspera文件夹
去根目录
ls -a #如果看到.aspera文件夹,代表安装成功
永久添加环境变量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc source ~/.bashrc
查看帮助文档,验证是否可以调用
ascp --help
这样你的电脑或者服务器就可以开启神器了
下面是开启命令
ascp -v -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200m anonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR347/SRR3474721/SRR3474721.sra ~/downloads
上面命令中SRR后面的数字就是下载文件的代号,大家应该能看懂规律吧。按照 中的Access list就能够一个一个的下载到你要的文件。
你可以看一下速度,

相关文章:

  • 多个子流程_协程工作流程的实现
  • Permission denied
  • wps交叉表_WPS文字小工具大用途—交叉引用的使用方法
  • 使用Trinity进行转录组组装
  • linux ssh连接交换机_【交换机】交换机如何配置ssh管理
  • python股票分析入门_学习用Python分析股票数据(入门)
  • Aspera 下载_SRA原始数据下载
  • keil5怎么配置程序风格_分享一个在Keil开发环境中配置代码格式化工具Astyle(美化代码风格)...
  • 01-rna-seq从头开始 卖萌哥
  • bc伐木机器人_BC教程之自动合成_我的世界BCmod教程 BCmod怎么玩__ 单机攻略_跑跑车单机游戏网...
  • FastQC或Trimmomatic去接头,低质量碱基
  • python中raise抛出异常_一文教你读懂Python中的异常信息
  • xargs 管道命令
  • android显示布局边界的边距_Android UI之布局
  • 变速恒频风电机组的优缺点_风电轴承的那些事
  • [LeetCode] Wiggle Sort
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • java8 Stream Pipelines 浅析
  • Java的Interrupt与线程中断
  • MD5加密原理解析及OC版原理实现
  • Netty 框架总结「ChannelHandler 及 EventLoop」
  • node学习系列之简单文件上传
  • Promise面试题2实现异步串行执行
  • Python socket服务器端、客户端传送信息
  • python3 使用 asyncio 代替线程
  • Spring技术内幕笔记(2):Spring MVC 与 Web
  • 当SetTimeout遇到了字符串
  • 基于OpenResty的Lua Web框架lor0.0.2预览版发布
  • 中国人寿如何基于容器搭建金融PaaS云平台
  • 7行Python代码的人脸识别
  • Mac 上flink的安装与启动
  • ​MPV,汽车产品里一个特殊品类的进化过程
  • ​渐进式Web应用PWA的未来
  • #QT(串口助手-界面)
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • (4)Elastix图像配准:3D图像
  • (arch)linux 转换文件编码格式
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第5节(封闭类和Final方法)
  • (DFS + 剪枝)【洛谷P1731】 [NOI1999] 生日蛋糕
  • (TipsTricks)用客户端模板精简JavaScript代码
  • (九)信息融合方式简介
  • (三)Hyperledger Fabric 1.1安装部署-chaincode测试
  • (十七)devops持续集成开发——使用jenkins流水线pipeline方式发布一个微服务项目
  • (转)Linux NTP配置详解 (Network Time Protocol)
  • (转)菜鸟学数据库(三)——存储过程
  • (轉貼) VS2005 快捷键 (初級) (.NET) (Visual Studio)
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • .a文件和.so文件
  • .Net Attribute详解(上)-Attribute本质以及一个简单示例
  • .net core 控制台应用程序读取配置文件app.config
  • .net core 微服务_.NET Core 3.0中用 Code-First 方式创建 gRPC 服务与客户端
  • .NET Core中Emit的使用
  • .NET I/O 学习笔记:对文件和目录进行解压缩操作
  • .net 按比例显示图片的缩略图
  • .net 获取url的方法