手记

python爬虫正则表达式之处理换行符以及其他

刚开始学python,记录下问题。
代码如下:

#coding:utf-8
import re,urllib2

def getHTML(url):
    html=urllib2.urlopen(url)
    html=html.read()
    return html

if __name__=='__main__':
    url='https://www.baidu.com'
    #处理换行符以及空格
    print getHTML(url).replace('\n','').replace('\t','').replace(' ','')

新手上路,特此记录~

2人推荐
随时随地看视频
慕课网APP