此代码片段旨在在所提供文件的每一行上搜索正则表达式匹配项。re.search() 被挂在文件中包含“#”字符的行 3e+5 次。
这个问题的解决方案是什么?
import re
print "Started..."
exp = "(.*)\$\$\$Uniqueterm:(.*)"
with open("sample.txt", 'r') as file:
for line in file:
if re.search(exp, line):
print "Found match: " + re.search(exp,line).groups()[1].strip()
print "File finished..."
示例输入文件(sample.txt):
abc
pqr
##### (3e+5 times '#' in a single line)
xyz
$$$Uniqueterm: Match it
qaz
预期输出:
Match it
慕盖茨4494581
当年话下
相关分类