在regexes中,单词边界是什么?

在regexes中,单词边界是什么?

我正在使用Java1.6中的Javaregexes(除其他外,用于解析数字输出),无法找到\b(“字界”)。我以为-12将是一个“整数字”(与之匹配)。\b\-?\d+\b但这似乎行不通。我很想知道如何匹配空格分隔的数字。

例子:

Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");String plus = " 12 ";System.out.println(""+pattern.matcher(plus).matches());
String minus = " -12 ";System.out.println(""+pattern.matcher(minus).matches());pattern = Pattern.compile("\\s*\\-?\\d+\\s*");
System.out.println(""+pattern.matcher(minus).matches());

返回:

truefalsetrue


Helenr
浏览 565回答 3
3回答

红颜莎娜

在大多数regex方言中,单词边界是介于\w和\W(非字符),如果字符串的开头或结尾分别以单词字符([0-9A-Za-z_]).所以,在字符串中"-12",它将在1之前或2之后匹配。破折号不是一个单词字符。

温温酱

单词边界可以出现在以下三个位置之一:在字符串中的第一个字符之前,如果第一个字符是单词字符。在字符串中的最后一个字符之后,如果最后一个字符是一个单词字符。在字符串中的两个字符之间,其中一个是单词字符,另一个不是单词字符。单词字符是α-数字;减号不是。摘自Regex教程.

人到中年有点甜

我说的是\b-样式regex边界实际上是这里.很短的故事是他们.条件性..他们的行为取决于他们的近在咫尺。#&nbsp;same&nbsp;as&nbsp;using&nbsp;a&nbsp;\b&nbsp;before:(?(?=\w)&nbsp;(?<!\w)&nbsp;&nbsp;|&nbsp;(?<!\W)&nbsp;)#&nbsp;same&nbsp;as&nbsp;using&nbsp;a&nbsp;\b&nbsp;after:(?(?<=\w)&nbsp;(?!\w)&nbsp;&nbsp;|&nbsp;(?!\W)&nbsp;&nbsp;)有时候那不是你想要的。详见我的另一个答案。
打开App,查看更多内容
随时随地看视频慕课网APP