我想从特定标签中提取元素。例如 - 一个站点中有四个。每个标签都有其他兄弟标签,如 p、h3、h4、ul 等。我想分别查看 h2[1] 元素、h2[2] 元素。
这就是我到目前为止所做的。我知道 for 循环没有任何意义。我也尝试附加文本但无法成功。然后我尝试按特定字符串进行搜索,但它给出了该特定字符串的唯一标签,而不是所有其他元素
from bs4 import BeautifulSoup
page = "https://www.us-cert.gov/ics/advisories/icsma-20-079-01"
resp = requests.get(page)
soup = BeautifulSoup(resp.content, "html5lib")
content_div=soup.find('div', {"class": "content"})
all_p= content_div.find_all('p')
all_h2=content_div.find_all('h2')
i=0
for h2 in all_h2:
print(all_h2[i],'\n\n')
print(all_p[i],'\n')
i=i+1
还尝试使用追加
tags = soup.find_all('div', {"class": "content"})
container = []
for tag in tags:
try:
container.append(tag.text)
print(tag.text)
except:
print(tag)
我是编程方面的新手。请原谅我糟糕的编码能力。我只想看到一切都在“缓解”之下。因此,如果我想将其存储在数据库中,它将解析与一列上的缓解相关的所有内容。
ITMISS
相关分类