正则表达式在错误的捕获组中存储匹配项

我正在尝试构建一个带有可选捕获组的 python 正则表达式。我的正则表达式适用于大多数情况,但未能将匹配项放在测试用例之一中的正确组中。

我想匹配和捕获以下情况:

  1. 命名空间::工具名称::1.0.1

  2. 命名空间::工具名称

  3. 工具名称::1.0.1

  4. 工具名称

这是我到目前为止的正则表达式:

(?:(?P<namespace>^[^:]+)::)?(?P<name>[^:]*)(?:::(?P<version>[0-9\.]+))?

这个正则表达式适用于我所有的 4 个测试用例,但我遇到的问题是在案例 3 中,tool_name 在命名空间组中被捕获,而 1.0.1 在名称组中被捕获。我希望它们分别被捕获在正确的组、名称和版本中

谢谢


叮当猫咪
浏览 203回答 1
1回答

天涯尽头无女友

您可以通过替换*with&nbsp;+(它看起来总是存在)来使 tool_name regex 部分成为强制性的,并限制此模式匹配三个点分隔的数字块,并具有负前瞻:^(?:(?P<namespace>[^:]+)::)?(?!\d+(?:\.\d+){2})(?P<name>[^:]+)(?:::(?P<version>\d+(?:\.\d+){2}))?查看正则表达式演示细节^&nbsp;- 字符串的开始(?:(?P<namespace>[^:]+)::)?- 一个可选的非捕获组匹配除:“命名空间”组之外的任何 1+ 个字符,然后只匹配::(?!\d+(?:\.\d+){2})- 不允许digits.digits.digits模式出现在当前位置之后的负前瞻(?P<name>[^:]+)&nbsp;- 组“名称”:除此之外的任何 1 个或多个字符&nbsp;:(?:::(?P<version>\d+(?:\.\d+){2}))?- 可选的非捕获组匹配::,然后组“版本”捕获 1+ 位数字和 1+ 位数字的 2 次重复.。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python