Linux中fasta文件的拆分与合并

Linux中fasta文件的拆分与合并

Fasta格式的文件是生物序列操作最为基本常用的格式。对于大文件,用linux命令对fasta格式的文件进行操作,能够极大的加快文件的使用便利性。

FASTA文件的拆分:
(1)如果从一个文件a提取第10至20个序列存到另一个文件b:

awk -v RS='>' 'NR>1{i++}i>=10&&i<=20{print ">"$0}' a.fasta|sed '/^$/d'>b.fasta

(2)将某一文件a中每一条序列保存到一个文件中:

awk '/^>/{f=++d".fasta"} {print > f}' input.fasta

FASTA文件合并:

cat *.fasta > output.fasta

除非特别声明,文章均为牛会飞的博客原创,遵循署名-非商业使用-相同方式共享授权协议
转载请注明出处: https://blogfei.com/linux-fasta-file-split-and-merge/

已有1条评论