猿问

无需正则表达式的Python处理HTTP链接标头

某些HTTP响应可以具有链接标头,例如<http://www.i_am_a_url.com>;rel="meta data"

有谁知道任何干净的方法来获取URL?如果可能,我宁愿不使用正则表达式,因为正则表达式会使代码难以读懂。


繁花不似锦
浏览 134回答 1
1回答

紫衣仙女

使用lxmlimpoprt lxml.htmlroot = lxml.html.fromstring(response_content_string)for a in root.cssselect('a[href]'):&nbsp; &nbsp; print(a)或者impoprt lxml.htmlroot = lxml.html.fromstring(response_content_string)for el, attr, url, _ in root.iterlinks():&nbsp; &nbsp; print(url)
随时随地看视频慕课网APP

相关分类

Python
我要回答