Python split()而不删除定界符

这段代码几乎可以满足我的需求。


for line in all_lines:

    s = line.split('>')

除了删除所有的'>'分隔符。


所以,


<html><head>

变成


['<html','<head']

有没有一种方法可以使用split()方法但保留定界符而不是删除定界符?


有了这些结果。


['<html>','<head>']


慕勒3428872
浏览 318回答 3
3回答

Helenr

d = ">"for line in all_lines:&nbsp; &nbsp; s =&nbsp; [e+d for e in line.split(d) if e]

守候你守候我

如果要使用拆分来解析HTML,则极有可能做错了,除非您编写的是针对固定和安全内容文件的单发脚本。如果应该在任何HTML输入上使用它,您将如何处理<a title='growth > 8%' href='#something'>?无论如何,以下对我有用:>>> import re>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]['<body>', '<table>', '<tr>', '<td>']

墨色风雨

只需将其拆分,然后为数组/列表中的每个元素(除最后一个元素外)在其后添加“>”。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python