我正在尝试创建简单的分词器,它在空格上拆分、小写标记、删除所有非字母字符,并仅保留 3 个或更多字符的术语。我写了这段代码,它可以处理小写、非字母字符,并且只保留 3 个或更多字符。但是我想用split这个方法,不知道怎么用。请提出一些建议。
public class main {
public static final String EXAMPLE_TEST = "This Mariana John bar Barr "
+ "12364 FFFFF aaaa a s d f g.";
public static void main(String[] args) {
Pattern pattern = Pattern.compile("(\\s[a-z]{3,20})");
Matcher matcher = pattern.matcher(EXAMPLE_TEST);
while (matcher.find()) {
System.out.print("Start index: " + matcher.start());
System.out.print(" End index: " + matcher.end() + " ");
System.out.println(matcher.group());
}
}
}
慕田峪7331174
四季花海
相关分类