import urllib.request
import re
req = urllib.request.urlopen('https://www.jd.com').read().decode('utf-8')
listurl = re.findall(r'http://.+\.jpg',req)
i = 0
for url in listurl:
filename = str(i)+'.jpg'
urllib.request.urlretrieve(url,filename)
i = i+1
代码如上,跟着老师的思路来的,但是什么都没有返回,请帮忙看看什么原因啊
爬数据需要分析网页源码,你可以看看京东的图片到底是以什么形式写在网页里的,我敢肯定必然不是"http://.+\.jpg"这种形式。不一定是"http"打头,不一定是jpg格式,可能由js生成,各种情况都存在,你用这种方法抓不到图片很正常