猿问

python如何正确抓取网页标题

通过urllib将网页内容抓取下来,然后用正则表达式re模块将标题匹配出来,但是发现部分标题会出现问题,比如下面抓Apple的代码运行结果是App,测试发现匹配结果m是没有问题的,问题出现在了strip()这里。#-*-coding:utf-8-*-
importurllib
importre
url='http://apple.com'
html=urllib.urlopen(url).read()
#printhtml
m=re.search(".*",html)
printm.group()#这里输出结果Apple
printm.group().strip("")#问题应该出现在这个正则
慕桂英546537
浏览 323回答 2
2回答
随时随地看视频慕课网APP

相关分类

JavaScript
我要回答