不知道为什么，同样的正则表达式，python2爬取的链接都正确，python3爬取的链接返回的url_list有个别错误，有谁知道是什么原因吗？

源自：4-2 python正则表达式练习

不知道为什么，同样的正则表达式，python2爬取的链接都正确，python3爬取的链接返回的url_list有个别错误，有谁知道是什么原因吗？

是不是需要优化正则表达式呢？

用这个做的匹配

list_url = re.findall(r'http:.+?\.jpg', buf)

python2下是正好抓完了szimg和img下的jpg

python3结果看图：

请问有谁知道是什么原因吗？

提问者：网络侦探 2017-07-31 19:41

个回答

qq_UncleSun_0

2018-07-09 23:01:35

不是走

0
慕九州5344597

2017-08-11 11:16:13

正则表达式不严谨，我也遇到过

0