我正在寻找一些建议,因为我是python的新手。
假设我有多个类似于以下内容的数据块:
<td> <a href="address.com" title=title">some title</a> <br /> aaa<br /> bbb<br /> ccc</td>
有时br的数目不同,并且对于所有块而言不是恒定的。
我的目的是从td块内部提取数据到文件,但是我被卡在了这里。
正则表达式是最好的方法吗?
相关分类