一:打开网页
import urllib2
req=urllib2.urlopen('http://www.imooc.com/course/list')
buf=req.read()
二:匹配网址
import re
listurl=re.findall(r'http:.+.jpg',buf)
三:写文件
i=0
for url in listurl:
f=open(str(i)+'.jpg','wb') #这里wb表示用二进制写方式打开文件
req=urllib2.urlopen(url)
buf=req.read()
f.write(buf)
i+=1
f.close()
这样,网页上的图片就被抓取到本地了(分别以1.jpg,2.jpg,3.jpg....保存在本地)
热门评论
看不懂啊,大神,啊啊啊啊啊啊