学海无涯之全栈工程师
2017-10-16 18:02
代码:html_doc = '<ul class=country><li>Area<li>Population</ul>'
soup = BeautifulSoup(html_doc, 'html.parser')
print (soup.prettify())
输出结果:
<ul class="country">
<li>
Area
<li>
Population
</li>
</li>
</ul>
为什么没有html标签和body标签 而且li标签的位置也不对
from bs4 import BeautifulSoup html_doc = '<ul class=country><li>Area<li>Population</ul>' #soup = BeautifulSoup(html_doc, 'html.parser') soup = BeautifulSoup(html_doc, 'lxml') print (soup.prettify()) 这样就可以了,区别一下HTML与lxml解析器
python遇见数据采集
59669 学习 · 200 问题
相似问题