使用 BeautifulSoup 抓取 IMG SRC

我正在尝试获取图像的 src,但我返回的 HTML 代码与网站上显示的 HTML 代码不同。


from bs4 import BeautifulSoup

import requests


headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}


url = "https://www.amazon.de/ASUS-Advanced-Grafikkarte-Speicher-Displayport/dp/B07VM9V59H/ref=sr_1_20?__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&crid=1928HLQLPKSTH&keywords=nvidia&qid=1585480732&s=computers&sprefix=nvid%2Ccomputers%2C171&sr=1-20"


response = requests.get(url, headers=headers).text

soup = BeautifulSoup(response, 'lxml')

title = soup.select("#productTitle")[0].get_text().strip()


imgdata = soup.find_all('img', {"alt":title})

print(imgdata)



守着一只汪
浏览 75回答 1
1回答

RISEBY

这是因为他们将图像编码为 base64,一旦您打开页面,就会在浏览器上呈现该图像。您可以从另一个属性获取图像 url,如下所示:img_url = imgdata[0].attrs['data-old-hires']
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Html5