我正在尝试使用下面列出的Java中的regex表达式来提取标签内的内容。我一直在尝试在标记中获取段落上下文,但无法获取它。
Some text without tags here...
<question1>
Paragraph 1...
Paragraph 2...
</question1>
Some text without tags here...
<question2>
Paragraph 1...
Paragraph 2...
</question2>
Some text without tags here...
上面的标签和内容存储在一个字符串变量中:stringToSearch。以下是我的代码。
Pattern p = Pattern.compile("<question1>(.*)</question1>");
Matcher a = p.matcher(stringToSearch);
System.out.print("\n Matching pattern...");
// Search the patterns in string
if (a.find()) {
String codeGroup = a.group(1);
System.out.format("'%s'\n", codeGroup);
}
但是我无法获得我怀疑是由于段落中可能出现新行的标签。reg表达式而不是xml解析器的原因是由于我可能必须使用| question |的环境。| /问题| 或[[question]] [[/ question]]特殊符号。
相关分类