正则表达式和否定整个字符组

3回答

慕丝7291255

使用否定前瞻：^(?!.*ab).*$更新：在下面的评论中，我说这种方法比彼得的答案慢。从那时起我就进行了一些测试，结果发现它确实稍微快一些。然而，偏爱另一种技术的原因不是速度，而是简单性。另一种技术，在这里描述为一种驯化的贪婪令牌，适用于更复杂的问题，例如匹配分隔符文本，其中分隔符由多个字符组成（如HTML，如Luke 在下面评论的那样）。对于问题中描述的问题，它太过分了。对于任何感兴趣的人，我测试了一大块Lorem Ipsum文本，计算不包含单词“quo”的行数。这些是我使用的正则表达式：(?m)^(?!.*\bquo\b).+$(?m)^(?:(?!\bquo\b).)+$无论是在整个文本中搜索匹配，还是将其分解为行并单独匹配，锚定前瞻一直优于浮动前瞻。

0 0

繁星淼淼

使用类似的字符类[^ab]将匹配不在字符集内的单个字符。（^作为否定的部分）。要匹配不包含多字符序列的字符串ab，您需要使用否定前瞻：^(?:(?!ab).)+$并且正则表达式注释模式中的上述表达是：(?x)    # enable regex comment mode^       # match start of line/string(?:     # begin non-capturing group  (?!   # begin negative lookahead    ab  # literal text sequence ab  )     # end negative lookahead  .     # any single character)       # end non-capturing group+       # repeat previous match one or more times$       # match end of line/string

0 0

德玛西亚99

是的，它被称为负向前瞻。它是这样的 - (?!regex here)。所以abc(?!def)将匹配abc 而不是def。所以它会匹配abce，abc，abck等。同样有积极的前瞻 - (?=regex here)。所以abc(?=def)匹配abc后跟def。也有负面和正面的背后 - (?<!regex here)和(?<=regex here)分别需要注意的一点是，负前瞻是零宽度。也就是说，它不算是占用了任何空间。所以它可能看起来像a(?=b)c匹配“abc”但它不会。它将匹配'a'，然后是'b'的正向前瞻，但它不会向前移动到字符串中。然后它会尝试将'c'与'b'匹配，这将无效。类似地，^a(?=b)b$匹配'ab'而不是'abb'，因为外观是零宽度（在大多数正则表达式实现中）。有关此页面的更多信息

0 0