我做了一个正则表达式,应该能够从html文件中分离出数字的特定顺序,但是在最后一部分中它不起作用。因此,这是html文件打印出来的方式:
0430\n
0500 20 40 53\n
0606 19 32 45 58\n
0711 22 33 44 55 \n
...
2000 20 40\n
2100 20 40\n
2200 20 40\n
2300 20 40\n
0000\n
\n
这是我的正则表达式:
timeRegex = re.compile(r'''((\d\d)(\d\d)
(\n|(\s
(\d\d)
\s?
(\d\d)?
\s?
(\d\d)?
\s?
(\d\d)?
\s?
(\d\d)?
)\n)?
)''',re.VERBOSE|re.DOTALL)
当查看列表时,它在大多数情况下都可以正常工作,直到列表中的最后一个元素获得0000为止,所以它看起来像这样的“ 2300 20 40 \ n0000 \ n \ n”,请帮忙。
繁星coding
www说
相关分类