我正在开发一个带有 BeautifulSoup的 python 网络爬虫,它从这个网站解析“产品列表”并提取每个产品列表的一些信息(即价格、供应商等)。我能够提取许多此类信息,但只有一个(即产品数量),这似乎是从原始html 中隐藏的。通过浏览器查看网页,我看到的是(unid = 单位):
product_name 1 unid $10.00
但它的 html 没有显示任何我可以提取的整数值。它显示了这个 html 文本:
<div class="e-col5 e-col5-offmktplace ">
<div class="kWlJn zYaQqZ gQvJw"> </div>
<div class="imgnum-unid"> unid</div>
</div>
我的问题是如何获取存储产品数量的隐藏内容e-col5?
import re
import requests
from bs4 import BeautifulSoup
page = requests.get("https://ligamagic.com.br/?view=cards%2Fsearch&card=Hapatra%2C+Vizier+of+Poisons")
soup = BeautifulSoup(page.content, 'html.parser')
vendor = soup.find_all('div', class_="estoque-linha", mp="2")
print(vendor[1].find(class_='e-col1').find('img')['title'])
print(vendor[1].find(class_='e-col2').find_all(class_='ed-simb')[1].string)
print(vendor[1].find(class_='e-col5'))
编辑: 在这种情况下,隐藏内容代表 JavasSript 动态更新的内容。
喵喵时光机
蝴蝶不菲
相关分类