我需要使用Selenium从网站中提取所有图像。这应该包括来自 html、css 和 javascript 的任何扩展名(png
、jpg
、svg
等)的所有图像。这意味着简单地提取所有<img>
元素是不够的(例如,将丢失任何从 css 样式加载的图像):
images = driver.find_elements_by_tag_name('img') # not sufficient
除了下载和解析网站所需的每个 css 和 javascript 脚本并使用正则表达式查找图像文件之外,还有什么更聪明的做法吗?
如果有一种方法可以在页面加载后只查找下载的资源,那将是理想的,类似于中的network
选项卡chrome dev tools
:
ABOUTYOU
相关分类