问答详情
源自:4-2 python正则表达式练习

不知道为什么,同样的正则表达式,python2爬取的链接都正确,python3爬取的链接返回的url_list有个别错误,有谁知道是什么原因吗?

是不是需要优化正则表达式呢?

用这个做的匹配

list_url = re.findall(r'http:.+?\.jpg', buf)

python2下是正好抓完了szimg和img下的jpg

python3结果看图:

http://img.mukewang.com/597f174d0001e17610990142.jpg

请问有谁知道是什么原因吗?

提问者:网络侦探 2017-07-31 19:41

个回答

  • qq_UncleSun_0
    2018-07-09 23:01:35

    不是走

  • 慕九州5344597
    2017-08-11 11:16:13

    正则表达式不严谨,我也遇到过