如何在 Django 中使用 BeautifulSoup 从嵌套 HTML 中获取数据

我正在尝试学习网页抓取,但我陷入了我想要的数据被 div 标签包裹的地步,如下所示:


<div class="maincounter-number">

<span style="color:#aaa">803 </span>

</div>

有几个这样的数据,我需要全部(例如 803)。所以我想我需要做 soup.find_all(...) 但我不知道该放什么进去。有人帮忙吗?


我正在 python (Django) 中工作。


杨__羊羊
浏览 81回答 1
1回答

MYYA

这应该可以完成您想要做的事情:from bs4 import BeautifulSouphtml_doc = '<div class="maincounter-number"><span style="color:#aaa">803 </span></div>'soup = BeautifulSoup(html_doc, 'html.parser')print(soup.find_all('span', {'style': 'color:#aaa'})[0].get_text())如果你只想查询div中的文本并按类别搜索:print(soup.find_all('div', {'class': 'maincounter-number'})[0].get_text())
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Html5