如何将包含重复 n 次的相同子字符串的字符串减少为子字符串的单个实例

我已经想出如何使用正则表达式来做到这一点。尽管我已经意识到它可能对我的目的没有用，因为 mmmm 可以是 2x mm（毫米）或 4x m（米）。虽然如果我只关心最多支持 3 次重复，我可以使用：if(preg_match('/^([a-z]*)\1{2}$/', $input, $matches)) {    $repeating = $matches[1];    $reps = 3;} elseif(if(preg_match('/^([a-z]*)\1$/', $input, $matches)) {    $repeating = $matches[1];    $reps = 2;} else {    $repeating = $input;    $reps = 1;}并不是说下面会把字符串分成最小的重复素数：preg_match('/^([a-z]*)\1+$/', $input, $matches);$repeating = $matches[1];这是此输出的表格：┌────────────┬────────────┐│   $input   │ $repeating │├────────────┼────────────┤│ mm         │ m          ││ mmm        │ m          ││ mmmm       │ mm         ││ mmmmm      │ m          ││ mmmmmm     │ mmm        ││ mmmmmmm    │ m          ││ mmmmmmmm   │ mmmm       ││ mmmmmmmmm  │ mmm        ││ mmmmmmmmmm │ mmmmm      │└────────────┴────────────┘因为只考虑最小的素数细分preg_match('/^([a-z]*)\1{1,2}$/', $input, $matches)不合适，因为它会像上表一样，发现 'mmmmmm' 的重复部分是 'mmm' 而不是所需的 mm。我在开头提供的三个案例实施是我目前正在使用的，因为我的输入通常是产品的年龄组或维度，我还没有看到产品被描述为超过三个维度或年龄组，'11yr,12yr,13yr,14yr'虽然我可以想象像后者这样的事情，无论多么罕见，最终都会发生。因此，我可能会放弃这种方法，转而使用 preg_match_all 从包含数字的原始字符串中提取单位：preg_match_all('/([0-9]+)\s*([a-z]*)\s*/', $input, $matches)然而，如果其他人实际上有兴趣找到最小的重复子字符串（所以 'm' 代表 'mmmm'），这可以通过循环中的正则表达式来完成：$repeating = $input;while(preg_match('/^([a-z]*)\1+$/', $repeating, $matches)) {    $repeating = $matches[1];}这将产生：┌────────────┬────────────┐│   $input   │ $repeating │├────────────┼────────────┤│ mm         │ m          ││ mmm        │ m          ││ mmmm       │ m          ││ mmmmm      │ m          ││ mmmmmm     │ m          ││ mmmmmmm    │ m          ││ mmmmmmmm   │ m          ││ mmmmmmmmm  │ m          ││ mmmmmmmmmm │ m          ││ cmcm       │ cm         ││ cmcmcm     │ cm         ││ cmcmcmcm   │ cm         ││ cmcmcmcmcm │ cm         │└────────────┴────────────┘

如何将包含重复 n 次的相同子字符串的字符串减少为子字符串的单个实例

4回答