Java regex是否支持Unicode?

为了使A与Z匹配,我们将使用正则表达式:


[A-Za-z]


如何允许正则表达式匹配用户输入的utf8字符?例如环保部等中文单词


紫衣仙女
浏览 810回答 3
3回答

GCT1015

Java正则表达式API适用于该char类型该char类型隐式为UTF-16如果您有UTF-8数据,则需要在输入时将其转码为UTF-16Unicode是通用的字符集,而UTF-8可以描述所有字符(包括控制字符,标点符号,符号,字母等)。您将必须更加明确地确定要包含的内容和要排除的内容。Java正则表达式使用\p{category}语法按类别匹配代码点。请参阅Unicode标准的列表类别。如果要在表意文字序列中识别和分隔单词,则需要查看更复杂的API。我将从BreakIterator类型开始。
打开App,查看更多内容
随时随地看视频慕课网APP