问答详情
源自:3-4 BeautifulSoup使用

beatuifulsoup没报错,但和预想的结果不一样

代码:html_doc = '<ul class=country><li>Area<li>Population</ul>'
soup = BeautifulSoup(html_doc, 'html.parser')
print (soup.prettify())

输出结果:

<ul class="country">

 <li>

  Area

  <li>

   Population

  </li>

 </li>

</ul>

为什么没有html标签和body标签  而且li标签的位置也不对

提问者:学海无涯之全栈工程师 2017-10-16 18:02

个回答

  • 慕沐6054047
    2017-10-17 09:11:58
    已采纳

    from bs4 import BeautifulSoup
    html_doc = '<ul class=country><li>Area<li>Population</ul>'
    #soup = BeautifulSoup(html_doc, 'html.parser')
    soup = BeautifulSoup(html_doc, 'lxml')
    print (soup.prettify())
    
    这样就可以了,区别一下HTML与lxml解析器