是不是需要优化正则表达式呢?
用这个做的匹配
list_url = re.findall(r'http:.+?\.jpg', buf)
python2下是正好抓完了szimg和img下的jpg
python3结果看图:
请问有谁知道是什么原因吗?
不是走
正则表达式不严谨,我也遇到过