如何使用正则表达式正确解析 Python 中的十六进制颜色代码？

3回答

森栏

你可以试试#(?:[0-9A-Fa-f]{6}|[0-9A-Fa-f]{3})(?=;|[^(]*\))所以这里的想法是6如果没有找到匹配字符匹配，则以更高的优先级匹配字符长度3，以确保它不匹配#BED或者我们需要匹配十六进制颜色代码的终止，所以我们使用带有交替的前瞻

桃花长相依

您可以使用r = re.compile(r'#[0-9A-Fa-f]{3}(?:[0-9A-Fa-f]{3})?(?!$)', re.M)见证明示例 Python 代码：import reregex = r"#[0-9A-Fa-f]{3}(?:[0-9A-Fa-f]{3})?(?!$)"test_str = ("#BED\n"    "{\n"    "    color: #FfFdF8; background-color:#aef;\n"    "    font-size: 123px;\n"    "    background: -webkit-linear-gradient(top, #f9f9f9, #fff);\n"    "}\n"    "#Cab\n"    "{\n"    "    background-color: #ABC;\n"    "    border: 2px dashed #fff;\n"    "}")matches = re.findall(regex, test_str, re.MULTILINE)print(matches)

梵蒂冈之花

一方面，您可以先匹配 6 位代码，否则匹配 3 位代码将首先匹配其中一半（因此不匹配完整的 6 位代码）。但是，由于您还只想匹配 CSS 属性规则，而不是选择器，请提前查找;、,或)：(?i)#(?:[0-9a-f]{6}|[0-9a-f]{3})(?=[;,)])https://regex101.com/r/BtZaoV/2如果您还需要能够排除组合选择器，例如#BED, foo {，您可以先查看非{s 后跟}：(?i)#(?:[0-9a-f]{6}|[0-9a-f]{3})(?=[^{]*})https://regex101.com/r/BtZaoV/3使用不区分大小写的标志来保持 DRY。（您也可以{3}){1,2}用来避免重复字符集，但这会使模式更难阅读 IMO）