python正则表达式的问题

<divclass="lib-cat"><h3>分类索引</h3><divclass="list"><ul><li><ahref="/search/movie">电影</a></li><li><ahref="/search/tv">电视剧</a></li><li><ahref="/search/show">综艺</a></li></ul></div>


想匹配出 电影,电视剧,综艺的链接,形成一个数组


aluckdog
浏览 249回答 2
2回答

炎炎设计

道理的解释,完整的代码和输出,以及个人的建议,全都写在帖子里了:【问题解答】建议:处理html时复杂的需求,建议使用专门的库比如BeautifulSoup去处理而不要用正则

侃侃尔雅

<divclass="lib-cat"><h3>分类索引</h3><divclass="list"& gt;<ul><li><ahref="(.*?)">电影</a></li& gt;<li><ahref="(.*?)">电视剧</a></li><li& gt;<ahref="(.*?)">综艺</a></li></ul>< /div>&nbsp;然后调用&nbsp;&nbsp; 正则表达式.findall(字符串)&nbsp;或者&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 正则表达式.search(字符串).groups()&nbsp;

吃鸡游戏

<divclass="lib-cat"><h3>分类索引</h3><divclass="list"& amp; gt;<ul><li>(<ahref=".*?">电影</a>)</li& gt;<li>(<ahref=".*?">电视剧</a>)</li><li& gt;(<ahref=".*?">综艺</a>)</li></ul>< /div>&nbsp;想要匹配哪一部分,就把那部分用括号框住,其中确定的文本不需要进行改动,不确定的文本用正则去表示就行了。&nbsp;上面的网址想精确点可以写成/\w+/\w+,电影、电视剧、综艺可以写成.*?或者.{2,3}。对于一般的的文本,几乎怎样匹配都不会有错,除非有人想为难你。&nbsp;
打开App,查看更多内容
随时随地看视频慕课网APP