处理 fasta 文件中多行显示的问题

假设我们下载到的 example.fasta 文件是这样的：

>sequence_1

ATGGATCCCATCAATT

GCTCAGCTGTGGATCT

CTCTGATGTTCTGGCC

AGCAAGATGAGTCCCA

>sequence_2

GTAAGATCCTCCTCTC

CCTGACTCTCTCTATTC

TGGCTGTGGCGACCAC

CACTATCAACTCCCTGG

TCATCACTGCTATTCTG

awk ‘/^>/&&NR>1{print “”;}{ printf “%s”,/^>/ ? $0″%”:$0 }’ example.fasta > example_edited_1.fasta

example_edited_2.fasta 文件的内容变成了这样：

>sequence_1

ATGGATCCCATCAATTGCTCAGCTGTGGATCTCTCTGATGTTCTGGCCAGCAAGATGAGTCCCA

>sequence_2G

TAAGATCCTCCTCTCCCTGACTCTCTCTATTCTGGCTGTGGCGACCACCACTATCAACTCCCTGGTCATCACTGCTATTCTG

awk ‘/^>/&&NR>1{print “”;}{ printf “%s”,/^>/ ? $0″ “:$0 }’ example.fasta > example_edited_2.fasta

example_edited_2.fasta 文件的内容变成了这样：

>sequence_1ATGGATCCCATCAATTGCTCAGCTGTGGATCTCTCTGATGTTCTGGCCAGCAAGATGAGTCCCA

>sequence_2GTAAGATCCTCCTCTCCCTGACTCTCTCTATTCTGGCTGTGGCGACCACCACTATCAACTCCCTGGTCATCACTGCTATTCTG