Linux系统上安装aspera并用其批量高速下载转录组数据_天天快讯
#使用aspera能够帮助我们批量高速下载转录组等数据,现在使用conda进行安装
(相关资料图)
conda install -c hcc aspera-cli -y
#检查是否安装成功,有东西出来就行
ascp -h
#另外看看asperaweb_id_文件是不是在miniconda3/etc文件夹中,务必确认该文件的位置。
#我们看看NCBI上面有什么样的转录组,在官网上打好毛果杨拉丁名,选择SRA搜索,我选了这个,点进去看看
#看到工程号,复制这个号,顺便看看别的一些信息,了解该转录组,看到这个是过表达了个PtrVCS2,在PUBMED搜下,文章发表在IJMS,DOI: /ijms24054458。
#复制工程号后,在ENA网站(/ena/browser/home),搜索
#往下拉,找到TSV,下载文件
#看见文件里面有每个SRR的下载地址,如果是单个文件下载的话,命令如下,下载到当前文件夹,速度居然有280Mb/s,学校服务器真强:
ascp -vQT -l 500m -P33001 -k 1 -i \
~/miniconda3/etc/asperaweb_id_ \
era-fasp@:/vol1/fastq/SRR229/051/SRR22954651/SRR22954651_ ./
#但是不可以这么笨笨哦,要学会批量下载。将刚刚下载的TSV文件整理成以下的样子,每行后面留一个空格,并且最后留一行空行出来,命名为:
#将传到linux系统中,批量生成命令行,输出文件command_:
awk '{print "ascp -vQT -l 500m -P33001 -k 1 -i ~/miniconda3/etc/asperaweb_id_ era-fasp@"$1" ./ &"}' > command_
#查看一下这个command_文件:
#在工作文件夹中,运行这个脚本,并挂载后台,记得两次enter:
nohup sh command_ &
#最后看看结果,3个实验组,3个对照组,双端测序,共12个文件
#一定要自己看懂理解代码,不可以照抄,aspera的教程有很多,有问题就百度吧。
#这两天突然高产
标签: