用python爬取图片URL存放在set里,为什么会有重复的?

import urllib2
import re

req = urllib2.urlopen('https://www.imooc.com/course/list')
listurl = re.findall(r'//img.+\.jpg', req.read())
fullurls = set()

for url in listurl:	
	fullurl = 'https:' + url
	fullurls.add(fullurl)
print fullurls


希希同学
浏览 1714回答 2
2回答

产品经理不是经理

你确定两个url的内容完全是一致的吗?
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python