Python split()而不删除定界符

这段代码几乎可以满足我的需求。


for line in all_lines:

    s = line.split('>')

除了删除所有的'>'分隔符。


所以,


<html><head>

变成


['<html','<head']

有没有一种方法可以使用split()方法但保留定界符而不是删除定界符?


有了这些结果。


['<html>','<head>']


白衣非少年
浏览 904回答 3
3回答

跃然一笑

d = ">"for line in all_lines:&nbsp; &nbsp; s =&nbsp; [e+d for e in line.split(d) if e]

潇湘沐

如果要使用拆分来解析HTML,则极有可能做错了,除非您编写的是针对固定和安全内容文件的单发脚本。如果应该在任何HTML输入上使用它,您将如何处理<a title='growth > 8%' href='#something'>?无论如何,以下对我有用:>>> import re>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]['<body>', '<table>', '<tr>', '<td>']
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python