关于正则表达式

w我现在用python 爬取网页内用要用到正则表达式,要爬的内容时这样的

是img中的 src内容

我用python写的正则是这样

links = re.findall('<a href=".*?".target=.*?>^[div]<img src="(.*?)".*?>.*?</a>')
可是却匹配到一些我不想要的 比如

怎么改一下正则才能不匹配这个带div标签的,谢谢了

慕森卡

浏览 704回答 1

幕布斯7119047

试试links = re.findall('<a href=".*?".target=.*?>\s*<img src="(.*?)".*?>\s*</a>')

0 0

随时随地看视频慕课网APP