python3.6中用beautifulsoup抓取网页内容时,关于lxml的错误

import requests
from bs4 import BeautifulSoup
import re

sum = 0
r = requests.get('https://book.douban.com/subject/5299764/comments/')
soup = BeautifulSoup(r.text, 'lxml')
pattern = soup.find_all('p','comment-content')
for item in pattern:
    print(item.string)
pattern_s = re.compile('<span class="user-stars allstar(.*?) rating"')
p = re.findall(pattern_s, r.text)
for star in p:
    sum += int(star)
print(sum)

http://img1.mukewang.com/59f9869000018d9b12530266.jpg

这个问题怎么解决?求大神指教。

鱼萌
浏览 2030回答 2
2回答

慕斯5016438

`BeautifulSoup(r.text, &#039;lxml&#039;)`第二个参数 lxml 是一个 package,需要安装: pip install lxml
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python