regex.WORD 如何影响\b 的行为？

首页课程实战体系课手记专栏慕课教程

我正在使用PyPI 模块regex进行正则表达式匹配。它说

默认 Unicode 字边界

该WORD标志将“字边界”的定义更改为默认 Unicode 字边界的定义。这适用于\b和\B。

但似乎什么都没有改变：

>>> r1 = regex.compile(r".\b.", flags=regex.UNICODE)

>>> r2 = regex.compile(r".\b.", flags=regex.UNICODE | regex.WORD)

>>> r1.findall("русский ελλανικα")

['й ', ' ε']

>>> r2.findall("русский ελλανικα")

['й ', ' ε']

我没有观察到任何区别......？

catspeake

浏览 183回答 1

随时随地看视频慕课网APP