我生成的序列文件如下:
>rpl-7
ATGGCTCCAAC
>rpl-7
AAGAAAGTGCCACAGGTTCCAGAAAC
>rpl-8
AAGAACAAGGAGAAGAAGACCCAATACTTCAAGCGTGC
>rpl-8
GCTCTCCAGATCCTCCGTCTTCGTCAGATCAA
>rpl-8
AAGTTCAACATCATCTGTCTTGAGGA
我想合并相同ID的序列,就像这样:
>rpl-7
ATGGCTCCAAC
AAGAAAGTGCCACAGGTTCCAGAAAC
>rpl-8
AAGAACAAGGAGAAGAAGACCCAATACTTCAAGCGTGC
GCTCTCCAGATCCTCCGTCTTCGTCAGATCAA
AAGTTCAACATCATCTGTCTTGAGGA
我用python判断以'>'开头的字符串是否相同,如果相同则继续增加序列。但是,这种方法无法输出第一个ID。另外,我认为使用awk会更容易,不幸的是我对 awk 不熟悉。你知道该怎么做吗?谢谢。
红颜莎娜
慕勒3428872
撒科打诨
相关分类