问答详情
源自:4-2 python正则表达式练习

关于爬取到的图片

为什么爬下来的图片是原网页中按照最热排序的,而手动打开原网页却是自动按最新排序的

#  Python 3.6.1
#                         ----By  Wang
import re
import urllib.request

req=urllib.request.urlopen('http://www.imooc.com/course/list')
buf=req.read()
buf=buf.decode('utf-8')
listurl=re.findall(r'src=.+?\.jpg',buf)

i=0
for url in listurl:
      url=re.search(r'http:.+?\.jpg',url)
      f=open(str(i)+'.jpg','wb')
      req=urllib.request.urlopen(url.group())
      buf=req.read()
      f.write(buf)
      f.close()
      i+=1



提问者:xxx3683148 2017-09-04 17:01

个回答

  • 慕斯卡5018863
    2017-09-04 23:21:23
    已采纳

    这个涉及写的时候URL重定向类似的问题,没影响的,是网页本身的问题,和你爬的没关系。