学习课程名称:0基础开发简单爬虫
章节名称:爬虫基础
讲师姓名:大壮老师
课程内容:
- http 和 Https 基础知识
- requests模块入门
- requests模块进阶
- xpath基础语法
- lxml模块
http:就是互联网上应用最广泛的一种网络协议,是客户端和服务端请求和应答的标准设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。
简单讲是HTTP的安全版,即HTTP+SSL/TLS,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL。
简单来说,HTTPS协议是由SSL/TLS+HTTP协议构建的可进行加密传输、身份认证的网络协议,要比http协议安 全。区别主要如下:
1、https协议需要到ca申请证书,一般免费证书较少,因而需要一定费用。
2、http是超文本传输协议,信息是明文传输,https则是具有安全性的ssl加密传输协议。
3、http和https使用的是完全不同的连接方式,用的默认端口也不一样,前者是80,后者是443。
4、http的连接很简单,是无状态的;HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,比http协议安全。
http请求的组成
请求行:请求的第一行是“方法URI协议/版本”。
消息报头:请求头包含许多有关的客户端环境和请求正文的有用信息。
请求正文:请求正 文中可以包含客户提交的查询字符串信息,在实际应用中,HTTP请求正文可以包含更多 的内容。
请求方法:GET、POST、HEAD、PUT、DELETE、TRACE、CONNECT、OPTIONS