套接字(
socket
)是一个抽象层,应用程序可以通过它发送或接收数据,可对其进行像对文件一样的打开、读写和关闭等操作。 套接字允许应用程序将I/O
插入到网络中,并与网络中的其他应用程序进行通信。 网络套接字是IP地址与端口的组合。
socket
相当于一个接口使得我们可以脱离应用层直接和传输层(以及其下的协议层)对接
1. socket流程
I. 服务端
创建socket对象 -> 绑定协议、端口等 -> 监听请求(等待客户端连接) -> 建立客户端连接 -> 关闭连接
II. 客户端
创建socket对象 -> 请求连接 -> 发送请求 -> 关闭连接
III. 流程图(两张图片配合理解)
IV. 实例
#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 文件名:server.py
import socket # 导入 socket 模块
s = socket.socket() # 创建 socket 对象
host = socket.gethostname() # 获取本地主机名
port = 12345 # 设置端口
s.bind((host, port)) # 绑定端口
s.listen(5) # 等待客户端连接
while True:
c,addr = s.accept() # 建立客户端连接
print ('连接地址:', addr)
c.send('hello world!'.encode('utf-8'))
c.close() # 关闭连接
# --------------------------------------------------------------------------------
#!/usr/bin/python
# -*- coding: UTF-8 -*-
# 文件名:client.py
import socket # 导入 socket 模块
s = socket.socket() # 创建 socket 对象
host = socket.gethostname() # 获取本地主机名
port = 12345 # 设置端口号
s.connect((host, port))
print (s.recv(1024))
s.close()
2. socket内建方法
函数 | 描述 |
---|---|
服务器端套接字 | ------------------------------------------------------ |
s.bind() | 绑定地址(host,port)到套接字, 在AF_INET下,以元组(host,port)的形式表示地址。 |
s.listen() | 开始TCP监听。backlog指定在拒绝连接之前,操作系统可以挂起的最大连接数量。该值至少为1,大部分应用程序设为5就可以了。 |
s.accept() | 被动接受TCP客户端连接,(阻塞式)等待连接的到来 |
客户端套接字 | ------------------------------------------------------ |
s.connect() | 主动初始化TCP服务器连接,。一般address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。 |
s.connect_ex() | connect()函数的扩展版本,出错时返回出错码,而不是抛出异常 |
公共用途的套接字函数 | ------------------------------------------------------ |
s.recv() | 接收TCP数据,数据以字符串形式返回,bufsize指定要接收的最大数据量。flag提供有关消息的其他信息,通常可以忽略。 |
s.send() | 发送TCP数据,将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。 |
s.sendall() | 完整发送TCP数据,完整发送TCP数据。将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。 |
s.recvfrom() | 接收UDP数据,与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。 |
s.sendto() | 发送UDP数据,将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。 |
s.close() | 关闭套接字 |
s.getpeername() | 返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。 |
s.getsockname() | 返回套接字自己的地址。通常是一个元组(ipaddr,port) |
s.setsockopt(level,optname,value) | 设置给定套接字选项的值。 |
s.getsockopt(level,optname[.buflen]) | 返回套接字选项的值。 |
s.settimeout(timeout) | 设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置 |
,因为它们可能用于连接的操作(如connect()) | |
s.gettimeout() | 返回当前超时期的值,单位是秒,如果没有设置超时期,则返回None。 |
s.fileno() | 返回套接字的文件描述符。 |
s.setblocking(flag) | 如果flag为0,则将套接字设为非阻塞模式,否则将套接字设为阻塞模式(默认值)。非阻塞模式下,如果调用recv()没有发现任何数 |
据,或send()调用无法立即发送数据,那么将引起socket.error异常。 | |
s.makefile() | 创建一个与该套接字相关连的文件 |
2. socket模拟HTTP请求
urllib本身也是在
socket
基础上做相应实现,同样的饿我们可以通过socket
发送http
请求
import socket
from urllib.parse import urlparse
def get_url(url):
host, path = urlparse(url).netloc, urlparse(url).path
if path == "":
path = "/"
# 建立socket连接
conn = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
conn.connect((host, 80)) # 获得连接
conn.send("GET {} HTTP/1.1\r\nHost:{}\r\nConnection:close\r\n\r\n".format(path, host).encode('utf-8'))
init_data = b""
while True:
data = conn.recv(1024)
if data:
init_data += data
else:
break
print(init_data.decode('utf-8')) # 包含头信息,可以用split取得纯html内容
conn.close() # 关闭连接
if __name__ == '__main__':
get_url('http://www.baidu.com')
- 多用户的请求可以通过多线程实现,主线程接收连接,每接收到请求的连接和地址就开线程处理请求
- send方法接收
bytes-like
对象 socket.socket([family[, type[, proto]]])
接收family(套接字家族可以使AF_UNIX或者AF_INET,代表UDP和TCP)
、type(套接字类型,可以根据是面向连接的还是非连接分为SOCK_STREAM或SOCK_DGRAM)
、protocol(一般不填默认为0)三个参数
3. socket.socket()参数说明
I. 地址簇
- socket.AF_INET:IPv4(默认)
- socket.AF_INET6:IPv6
- socket.AF_UNIX:只能够用于单一的Unix系统进程间通信
II. 套接字类型
socket.SOCK_STREAM
:流式socket , for TCP (默认)
socket.SOCK_DGRAM
:数据报式socket , for UDP
socket.SOCK_RAW
:原始套接字,普通的套接字无法处理ICMP、IGMP
等网络报文,而SOCK_RAW
可以;其次,SOCK_RAW
也可以处理特殊的IPv4
报文;此外,利用原始套接字,可以通过IP_HDRINCL
套接字选项由用户构造IP
头。socket.SOCK_RDM
::是一种可靠的UDP
形式,即保证交付数据报但不保证顺序。SOCK_RAM
用来提供对原始协议的低级访问,在需要执行某些特殊操作时使用,如发送ICMP
报文。SOCK_RAM
通常仅限于高级用户或管理员运行的程序使用。socket.SOCK_SEQPACKET
:可靠的连续数据包服务
III. 协议
- 0:(默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套 接类别,自动选择一个合适的协议