对于给定的字符串,如下所示:
'Rob and Amber Mariano, Heather Robinson, Jane and John Smith, Kiwan and Nichols Brady John, Jimmy Nichols, Melanie Carbone, Jim Green and Nancy Brown, Todd and Sana Clegg with Tatiana Perkin'
我想确定可能被称为“John 和 Jane Doe”的夫妇或其他家庭成员,并排除“Jim Green 和 Nancy Brown”等案例。
我只想识别以下内容:
Rob and Amber Mariano, Jane and John Smith, Kiwan and Nicholas Brady John, Todd and Sana Clegg
下面正则表达式中的组似乎捕获了我想要的大多数情况,但我在排除“Jim Green”时遇到了麻烦。
我想提出的条件是第一个单词是一个名称,但它要么位于字符串的开头,要么前面只有空格和逗号。
但由于某种原因,我的表达不起作用。我期望 ([^|,\s']?) 捕捉到这一点,但它似乎并没有这样做。
([^|\,\s]?)([A-Z][a-zA-Z]+)(\s*and\s*)([A-Z][a-zA-Z]+)(\s[A-Z][a-zA-Z]+)(\s[A-Z][a-zA-Z]+)?
慕尼黑5688855
慕婉清6462132
皈依舞
相关分类