我有一个包含姓名的列,它们都是串联的(也就是说,名字和姓氏之间没有空格)。我正在尝试拆分名字和姓氏,该网站上已经询问过这个问题。然而在这里,有些名称带有破折号\-
或撇号\'
。
Speed-WagonMario CruiserPetey SthesiaAnna De’wayneJohn
我想确保它被我的正则表达式查询捕获:
clean_names = re.split(r'([A-Z][a-z\']+\-[A-Z][a-z\']+|[A-Z][a-z\']+)', names)
它适用于破折号,破折号仅出现在大写字母之前,但不适用于撇号。
有人对如何解决我的查询有意见吗?提前致谢
收到一只叮咚
相关分类