在数据分析中,数据以脏形式传送给我们是很常见的,其中存在与转录或下载方式相关的错误。由于我们知道DNA的任何序列都必须由四个碱基组成'a','g'因此DNA中出现't'的'c'任何其他字母一定是错误的。编写一个函数clean(dna),返回一个新的 DNA 字符串,其中除 A、C、G 或 T 之外的每个字符都被替换为 N。例如,clean('goat')应返回字符串'gnat'。您可以假设 dna 全部为小写,但不要假设任何有关错误字符的性质(例如,它们甚至可能被意外转录为数字)。
clean('') → ''
clean('agct7ttczttctgactgcaacgggcaatatgtctctxtgtggattaaaaaaagagtgtcygatagcagcttctgaactggttacctgcc') → 'agctnttcnttctgactgcaacgggcaatatgtctctntgtggattaaaaaaagagtgtcngatagcagcttctgaactggttacctgcc'
clean('gtgagtaaattaaaattttnttgacttaggtcactaaptactttaaccaatataggbatagcgcacagacagataaaaattacagagtac') → 'gtgagtaaattaaaattttnttgacttaggtcactaantactttaaccaatataggnatagcgcacagacagataaaaattacagagtac'
使用for循环
HUH函数
HUX布斯
相关分类