猿问

Python Regex - 获取匹配的单词

我想在比赛前后得到单词。我可以使用string.split(' ')- 但由于我已经使用了正则表达式,难道没有更好的方法只使用正则表达式吗?


使用匹配对象,我可以获得确切的位置。但是,此位置是字符索引的。


import re


myString = "this. is 12my90\nExample string"

pattern = re.compile(r"(\b12(\w+)90\b)",re.IGNORECASE |  re.UNICODE)


m = pattern.search(myString)

print("Hit: "+m.group())

print("Indix range: "+str(m.span()))

print("Words around match: "+myString[m.start()-1:m.end()+1]) # should be +/-1 in _words_, not characters

输出:


命中:12my90 指数


范围:(9, 15)


比赛周围的话:12my90


为了获得匹配的单词和之前的单词,我尝试了:


pattern = re.compile(r"(\b(w+)\b)\s(\b12(\w+)90\b)",re.IGNORECASE | 

re.UNICODE)

这不会产生匹配项。


至尊宝的传说
浏览 132回答 2
2回答

炎炎设计

在第二种模式中,您必须逃避w+like \w+。除此之外,您的示例中有一个换行符,您可以使用另一个以下内容进行匹配\s您具有 3 个捕获组的模式可能看起来像(\b\w+\b)\s(\b12\w+90\b)\s(\b\w+\b)正则表达式演示您可以使用捕获组来获取值print("Words around match: " + m.group(1) + " " + m.group(3))

长风秋雁

缺少换行符regx = r"(\w+)\s12(\w+)90\n(\w+)"
随时随地看视频慕课网APP

相关分类

Python
我要回答