解码URL中的转义字符

我有一个列表,其中包含带有转义字符的网址。这些字符是urllib2.urlopen在恢复html页面时设置的:


http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=edit

http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=history

http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh 

有没有办法在python中将它们转换回未转义的形式?


PS:URL以utf-8编码


哆啦的时光机
浏览 717回答 3
3回答

德玛西亚99

官方文档。urllib.unquote(串)用%xx单字符等效替换转义符。示例:unquote('/%7Econnolly/')收益率'/~connolly/'。然后只是解码。更新: 对于Python 3,请编写以下内容:urllib.parse.unquote(url)Python 3文档。

慕容708150

如果您正在使用,Python3您可以使用:urllib.parse.unquote(url)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python