新手，不知道怎么解决-慕课网

首页课程实战体系课手记专栏慕课教程

新手，不知道怎么解决

来源：4-2 python正则表达式练习

慕侠2747441

2017-05-04 21:48

>>> i=0

>>> for url in listurl:

f=open('E:/python/mi/'+str(i)+'.jpg','wb')

req=urllib2.urlopen(url)

buf=req.read()

f.write(buf)

i+=1

Traceback (most recent call last):

File "<pyshell#14>", line 3, in <module>

req=urllib2.urlopen(url)

File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\urllib2.py", line 126, in urlopen

return _opener.open(url, data, timeout)

File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\urllib2.py", line 384, in open

protocol = req.get_type()

File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\urllib2.py", line 245, in get_type

raise ValueError, "unknown url type: %s" % self.__original

ValueError: unknown url type: src="//c1.mifile.cn/f/i/2014/cn/placeholder-220!110x110.png" data-src="//c1.mifile.cn/f/i/g/2015/xiaomiNOTE2-320-220!160x110.jpg" srcset="//c1.mifile.cn/f/i/g/2015/xiaomiNOTE2-320-220!320x220.jpg

写回答关注

4回答

华灯初上丶

2018-01-27 22:17:13

我用的pycharm，今天才手写的代码，改了几个小地方，都写在注释里面，楼主看看注意到没有，谢谢。

import re

import urllib

req = urllib.request.urlopen('http://www.imooc.com/course/list')

#此处加上decode()，不然拿下来的数据都是乱码

buf = req.read().decode("utf-8")

#老师讲课的url地址已经发生改变，改一下正则匹配就好

# listurl = re.findall(r'src=.+\.jpg', buf)

listurl = re.findall(r'//img.+?\.jpg', buf)

# 改成非贪婪模式就行了

#前面没有了http：，那么这里手动加上

for index,app_id in enumerate(listurl):

listurl[index] = str(app_id).replace('//', 'http://')

print(index, listurl[index])

print(listurl)

i = 0

for url in listurl:

#写入模式修改为“wb+”，不然不支持将bytes写入，亲测

f = open(str(i)+".jpg", "wb+")

req = urllib.request.urlopen(url)

buf = req.read()

f.write(buf)

i+=1

f.close()

0 2
ECNUGHOST

2018-01-18 18:32:54

我也是这个情况。。。

0 0

qq_天涯_45: 2017-05-08 14:56:16

import urllib2,re
req = urllib2.urlopen('http://www.imooc.com/course/list')
buf = req.read()
listurl = re.findall(r'http:.+\.jpg',buf)
print listurl[1]

i=0
for url in listurl:
    f = open(str(i)+'.jpg','wb')
    req = urllib2.urlopen(url)
    buf =req.read()
    f.write(buf)
    i+=1

0 0

qq_天涯_45: 2017-05-08 14:56:09

import urllib2,re
req = urllib2.urlopen('http://www.imooc.com/course/list')
buf = req.read()
listurl = re.findall(r'http:.+\.jpg',buf)
print listurl[1]

i=0
for url in listurl:
    f = open(str(i)+'.jpg','wb')
    req = urllib2.urlopen(url)
    buf =req.read()
    f.write(buf)
    i+=1

0 0

python正则表达式

如何使用正则处理文本，带你对python正则有个全面了解

80569 学习 · 176 问题

查看课程

相似问题

新手求解，谢谢

回答 3

这个问题怎么解决啊

回答 2

用的python3，出现这个问题，请问大神怎么解决

回答 3

有个问题非常难懂，我不知道该任何学起

回答 2

str1='num1'='100'出现SyntaxError: can't assign to literal错误怎么解决

回答 2

打开慕课网App查看更多内容