Python爬虫入门的一课-原创手记-慕课网

Python爬虫入门的一课

caijunyi_henry 2019-12-09 17:32:55 浏览 4107

caijunyi_henry

关注TA

手记 4

粉丝 2

获赞 5

今天，我来讲解一下Python爬虫

我讲的Python爬虫用的模块：

urllib
BeautifulSoup

今天，我先讲urllib。

urllib是下载源码用的。BeautifulSoup是解析数据的。打个比方，我们要买一个鱼。urllib是把鱼给买下来。BeautifulSoup负责解析鱼（将鱼刺和鱼肉分开等）

因此，BeautifulSoup是最重要的

首先下载urllib：pip install urllib。

然后，打开IDLE，编写您的第一个爬虫程序：

import urllib.request #导入块
url="" #url地址，这里是慕课网
yuanma=urllib.request.urlopen(url).read().decode('utf-8')
'''
urllib.request.urlopen(url).read()是必须的，请大家背下来，decode是编码，这里是utf-8
'''
print(yuanma) #打印源码

好了，您的第一个爬虫就做完了！

欢迎大家关注我的手记，我即将为您讲解BeautifulSoup！

对了，如果觉得文章好，记得点赞！

1人推荐

发表评论