猿问

如何用beautifulsoup提取网页某一部分的所有链接?

我只需要提取网页中某个部分的链接,但我在 Beautifulsoup 上找到的所有教程总是抓取整个页面。

我如何只抓取某个内的链接<div class="xyz">???

编辑:我目前有这段代码:

soup1.find_all('h3', class_="entry-title td-module-title")

这会找到网页的所有链接,这些链接包含在class_="entry-title td-module-title"

我想找到类中仍然包含的所有链接

"entry-title td-module-title"`

但仅包含在以下部分中的那些:

<div class="wpb_wrapper">

(对不起,如果我的问题有点缺乏信息,我试着添加更多细节)


肥皂起泡泡
浏览 174回答 2
2回答

www说

尝试这个:soup2 =&nbsp; soup1.find_all('div',class_='wpb_wrapper')results = []for div in soup2:&nbsp; &nbsp; required = div.find_all('h3', class_="entry-title td-module-title")&nbsp; &nbsp; results.append(required)

翻过高山走不出你

您可以使用 CSS 选择器来完成此任务:for&nbsp;link&nbsp;in&nbsp;soup.select('div.wpb_wrapper&nbsp;h3.entry-title.td-module-title&nbsp;a'): &nbsp;&nbsp;&nbsp;&nbsp;print(link['href'])<h3 class="entry-title td-module-title">这将打印under 下的所有链接<div class="wpb_wrapper">。
随时随地看视频慕课网APP

相关分类

Python
我要回答