python字符串截取问题?

有多组长的字符串,如1. AGAATTGCA 2.AGAACCTTGACTGTA 3.AGTTCGGTAAGC,想对每个字符串进行如下操作:每四个截取出来,然后往后一个字母继续截取四个。举个例子,拿第一组来说,我要得到的是AGAA, GAAT, AATT, ATTG, TTGC, TGCA。同样对第二组数据也进行同上操作。然后进行统计,相同的字母组合出现的次数。例如第二组数据第一个出现的也是AGAA,那么AGAA就一共出现了两次,其他的字母组合也做同样的统计,最后输出结果:字母,出现的次数

http://img.mukewang.com/5892889f0001a36f09601280.jpg

求大神指导,本人非计算机背景,此题为老师布置的作业,为Python2.7,老师提示用hash,因为数据特别多也特别大,我只是简单说明了一下题的意思

liyixinaaa
浏览 1355回答 1
1回答

subarashiigyoku

x = "XGAGAGGAGAGGG....."y = list(x) 转成列表 ['X','G','A','G',.....]用两层for循环第一层循环下标,第二层for用第一层的for的下标值往后循环4次 通过字符串 +=的方式拼接一个值。再在第二层for中做个下标越界判断进行break。刚学Python,用的是java,php的那种最老土的方法。我是列表和字典搞了半天和数组的区别还没弄清。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python