如何使用正则表达式匹配骆驼大小写标识符？

首页课程实战体系课手记专栏慕课教程

如何使用正则表达式匹配骆驼大小写标识符？

我需要匹配骆驼案例变量。我忽略了名称中带有数字的变量。

private const String characters = @"\-:;*+=\[\{\(\/?\s^""'\<\]\}\.\)$\>";

private const String start = @"(?<=[" + characters +"])[_a-z]+";

private const String capsWord = "[_A-Z]{1}[_a-z]+";

private const String end = @"(?=[" + characters + "])";

var regex = new Regex($"{start}{capsWord}{end}",

RegexOptions.Compiled | RegexOptions.CultureInvariant) }

这非常适合匹配单个驼峰变量！但不是多个，也不是满足行尾的那个。我认为我的角色中的 $ 或 ^ 会允许它们匹配。

abcDef // match

notToday<end of line> // no match

<start of line>intheBeginning // no match

whatIf // match

"howFar" // match

(whatsNext) // match

ohMyGod // two humps don't match

我也试过像这样“（capsWord）+”包装我的capsWord，但它也不起作用。警告！正则表达式测试器使用此“(capsWord)+”进行在线匹配，因此不要从那里通过测试来验证和响应。

当我进行更改时，我的部署似乎没有得到更新，所以毕竟可能没有问题。

除了行首问题之外，以下几乎可以工作。请注意，我注意到我不需要后缀部分，因为匹配以 [az] 内容结尾。

private const String characters = @"\-:;*+=\[\{\(\/?\s^""'\<\]\}\.\)$\>";

private const String pattern = "(?<=[" + characters + "])[_a-z]+([A-Z][a-z]+)+";

abcDef // match

notToday<end of line> // match

<start of line>intheBeginning // no match

whatIf // match

"howFar" // match

(whatsNext) // match

ohMyGod // match

所以，如果有人能解决它，请告诉我。

我还将其他字符简化为更简洁的表达式，但从行首匹配仍然存在问题。

private const String pattern = "(?<=[^a-zA-Z])[_a-z]+([A-Z][a-z]+)+";

隔江千里

浏览 259回答 2

2回答

慕标琳琳

您可以匹配前缀和后缀之间的空位置来拆分驼峰式标识符(?<=[_a-z])(?=[_A-Z])前缀包含小写字母，后缀包含大写字母。如果要匹配 camelCase 标识符，可以使用(?<=^|[^_a-zA-Z])_*[a-z]+[_a-zA-Z]*怎么运行的：(?<=                Match any position pos following a prefix exp    (?<=exp)pos    ^               Beginning of line    |               OR    [^_a-zA-Z]      Not an identifier character)_*                  Any number of underlines[a-z]+              At least one lower case letter[_a-zA-Z]*          Any number of underlines and lower or upper case letters所以，它基本上说：匹配一个序列，可选地以下划线开头，后跟至少一个小写字母，可选地后跟下划线和字母（大写和小写），并且整个内容必须以行首或开头非标识符字符。这对于确保我们不仅匹配以大写字母（或下划线和大写字母）开头的标识符的结尾是必要的。var camelCaseExpr = new Regex("(?<=^|[^_a-zA-Z])_*[a-z]+[_a-zA-Z]*");MatchCollection matches = camelCaseExpr.Matches("whatIf _Abc _abc howFar");foreach (Match m in matches) {    Console.WriteLine(m.Value);}印刷whatIf_abchowFar

0 0

牧羊人nacy

今天遇到了同样的问题，对我有用的是：\b([a-z][a-z0-9]+[A-Z])+[a-z0-9]+\b注意：这是用于 PCRE 正则表达式解释：`(` group begin`[a-z]` start with a lower-case letter`[a-z0-9]+` match a string of all lowercase/numbers`[A-Z]` an upper-case letter`)+` group end; match one or more of such groups.以更多的小写/数字结尾。 \b用于单词边界。就我而言，_camelCaseIdent_s 单词之间只有一个大写字母。所以，这对我有用，但如果你可以有（或想要匹配）多个大写字母之间，你可以做类似的事情[A-Z]{1,2}

0 0

随时随地看视频慕课网APP

相关分类

C#: typedef入门问题 1 回答