继续浏览精彩内容
慕课网APP
程序员的梦工厂
打开
继续
感谢您的支持,我会继续努力的
赞赏金额会直接到老师账户
将二维码发送给自己后长按识别
微信支付
支付宝支付

python抓取图片

慕莱坞森
关注TA
已关注
手记 266
粉丝 35
获赞 146

#!/usr/bin/env python#_*_ coding utf-8 _*_import reimport urllib.requestimport urllibimport osdef getHtml(url):
    page = urllib.request.urlopen(url)
    html = page.read()    return html.decode('GBK')def getImg(html):
    reg = r'[src=|"p_img_url":]"(http\:\/\/pic\.xxxx\.com/upload/.+?\.jpg)'
    imgre = re.compile(reg,re.I)
    imglist = imgre.findall(html)    for imgurl in imglist:
        print(imgurl)
        urllib.request.urlretrieve(imgurl,'{}{}'.format(paths,imgurl.split("//")[1].split('/')[-1]))#根据商品ID抓取图片f=open('id1.txt','r')for i in f.readlines():
    num1=i.replace('\n','')
    path = 'D:\\test\\'+num1    if not os.path.isdir(path):
        os.makedirs(path)
    paths = path+'\\'
    html = getHtml("http://www.xxxx.com/Product-0-%s.htm" % num1)
    getImg(html)
f.close()

打开App,阅读手记
0人推荐
发表评论
随时随地看视频慕课网APP