关于正则表达式

w我现在用python 爬取网页内用要用到正则表达式,要爬的内容时这样的

https://img.mukewang.com/5b8261720001daff04870056.jpg

是img中的 src内容

我用python写的正则是这样

links = re.findall('<a href=".*?".target=.*?>^[div]<img src="(.*?)".*?>.*?</a>')
可是却匹配到一些我不想要的 比如

https://img1.mukewang.com/5b8261810001ab5704820091.jpg

怎么改一下正则才能不匹配这个带div标签的,谢谢了


慕森卡
浏览 591回答 1
1回答

幕布斯7119047

试试links&nbsp;=&nbsp;re.findall('<a&nbsp;href=".*?".target=.*?>\s*<img&nbsp;src="(.*?)".*?>\s*</a>')
打开App,查看更多内容
随时随地看视频慕课网APP