我正在使用PyPI 模块regex进行正则表达式匹配。它说
默认 Unicode 字边界
该WORD标志将“字边界”的定义更改为默认 Unicode 字边界的定义。这适用于\b和\B。
但似乎什么都没有改变:
>>> r1 = regex.compile(r".\b.", flags=regex.UNICODE)
>>> r2 = regex.compile(r".\b.", flags=regex.UNICODE | regex.WORD)
>>> r1.findall("русский ελλανικα")
['й ', ' ε']
>>> r2.findall("русский ελλανικα")
['й ', ' ε']
我没有观察到任何区别......?
相关分类