问答详情
源自:4-2 python正则表达式练习

为何爬京东首页的图片失败啊

import urllib.request
import re

req = urllib.request.urlopen('https://www.jd.com').read().decode('utf-8')
listurl =  re.findall(r'http://.+\.jpg',req)
i = 0
for url in listurl:
   filename = str(i)+'.jpg'
   urllib.request.urlretrieve(url,filename)
   i = i+1

代码如上,跟着老师的思路来的,但是什么都没有返回,请帮忙看看什么原因啊

提问者:慕粉2145014470 2017-05-14 16:17

个回答

  • Sprint_RS
    2017-05-15 21:48:51

    爬数据需要分析网页源码,你可以看看京东的图片到底是以什么形式写在网页里的,我敢肯定必然不是"http://.+\.jpg"这种形式。不一定是"http"打头,不一定是jpg格式,可能由js生成,各种情况都存在,你用这种方法抓不到图片很正常