我想从页面中抓取元素,例如页面 - https://www.aacr.org/?s=breast+cancer&search_type=global
标题的 html 标签包含一个 html 链接和附加的标题。当我运行代码时,它会打印 HTML(第一个位置),然后打印标题(第二个位置/我想要的内容)
例如 - 打印返回 -> <a href="https://www.aacr.org/ Patients-caregivers/cancer/breast-cancer/" title="Breast Cancer ">乳腺癌,
我只想要粗体/第二个元素,有什么帮助吗?这是我的代码 -
import requests
import time
from bs4 import BeautifulSoup
import pandas as pd
productlinks = []
sam=[]
for x in range(1,3):
url=f'https://www.aacr.org/page/{x}/?s=breast+cancer&search_type=global'
r=requests.get(url)
soup=BeautifulSoup(r.content,'html.parser')
productlist=soup.find_all('div',class_='blog-content')
for item in productlist:
title=soup.find_all('h3')
print(title)
阿晨1998
三国纷争
相关分类