regex.WORD 如何影响\b 的行为?

我正在使用PyPI 模块regex进行正则表达式匹配。它说


默认 Unicode 字边界


该WORD标志将“字边界”的定义更改为默认 Unicode 字边界的定义。这适用于\b和\B。


但似乎什么都没有改变:


>>> r1 = regex.compile(r".\b.", flags=regex.UNICODE)

>>> r2 = regex.compile(r".\b.", flags=regex.UNICODE | regex.WORD)

>>> r1.findall("русский  ελλανικα")

['й ', ' ε']

>>> r2.findall("русский  ελλανικα")

['й ', ' ε']

我没有观察到任何区别......?


catspeake
浏览 135回答 1
1回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python