将字符串拆分为单词和标点符号

我正在尝试将字符串拆分为单词和标点符号,并将标点符号添加到拆分生成的列表中。


例如:


>>> c = "help, me"

>>> print c.split()

['help,', 'me']

我真正希望列表看起来像是:


['help', ',', 'me']

因此,我希望将字符串在空白处拆分,并将标点符号与单词分开。


我尝试先解析字符串,然后运行拆分:


>>> for character in c:

...     if character in ".,;!?":

...             outputCharacter = " %s" % character

...     else:

...             outputCharacter = character

...     separatedPunctuation += outputCharacter

>>> print separatedPunctuation

help , me

>>> print separatedPunctuation.split()

['help', ',', 'me']

这会产生我想要的结果,但是在大文件上速度很慢。


有办法更有效地做到这一点吗?


慕无忌1623718
浏览 859回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python