手记

Python的进程、线程、协程


从操作系统角度

操作系统处理任务,调度单位是进程线程

进程:表示一个程序的执行活动(打开程序、读写程序数据、关闭程序)
线程:执行某个程序时,该进程调度的最小执行单位(执行功能1,执行功能2)

一个程序至少有一个进程,一个进程至少有一个线程。

并行:
需要处理的任务数 == CPU核心数量

两个任务,两个核心

任务1:-------------
任务2:-------------

并发:
需要处理的任务数 > CPU核心数量

三个任务,一个核心
任务1: ----- ------
任务2: ------
任务3: ------

从程序角度

多进程、多线程
表示当前程序可以同时执行多个任务

进程和线程都是由操作系统调度完成。

进程:

  • 每个进程都有自己独立的内存空间,不同进程之间的内存空间不能共享。

  • 不同进程之间的通信由 操作系统 完成。

  • 不同进程之间的通信效率低下,切换开销大。

线程:

  • 一个进程下可以有多个线程,同一个进程内的线程可以共享内存空间.

  • 不同线程之间的通信 有进程 管理。

  • 不同线程之间的通信效率高,切换开销小。

互斥锁:

共享意味着多个线程的竞争,会导致不安全问题。
为了保护内存空间的数据不被多个线程同时读写,导致数据隐患,于是诞生了"互斥锁"。

"互斥锁":一种安全有序的让多个线程访问进程内存空间的机制。
当一个线程在访问进程内存空间时,互斥锁可以防止其他线程访问

解释型语言:执行程序时,解释器按行执行程序内容,执行时检查问题。
编译型语言:通过编译器将程序编译为一个可执行文件,执行前检查问题。

Python中的多线程:

GIL(全局解释器锁):同一时刻只能有一个线程在运行。

坏处:多线程不能充分利用多核CPU资源。
好处:从根本上杜绝了多线程访问内存空间的安全问题。

Python的多线程不适合并行,但非常适合并发。

Python的多线程在遇到 IO阻塞函数执行,会自动释放GIL,让后面的线程执行任务。
如果没有 IO 操作,那么解释器会每隔100次操作后,强制释放GIL,让后面的线程执行。
import sys
sys.getcheckinterval()

多进程:

适用于密集CPU任务,可以充分调度CPU资源(大量的并行运算)。
multiprocessing

缺点:不适用于需要大量数据通信和多次切换的场景,因为进程之间通信和切换成本高。

多线程:

适用于密集IO任务(网络IO,磁盘IO,数据库IO),在IO阻塞时可以切换线程执行。
threading.Thread、multiprocessing.dummy

缺点:同一个CPU时间片只能执行一个任务,不能做到并行,只能做到并发。
优点:线程之间切换和通信非常方便,开销小。

协程:

由程序员自行编写调度功能,切换协程就好比切换一个函数,几乎没有切换开销。
特点是在单线程上执行多个任务,调度由程序员控制,不经过操作系统,所以没有进程线程的切换开销,也不需要处理锁。
gevent
monkey.patch_all()

monkey的作用是将Python底层的网络库socket、select自动打个补丁,程序在遇到网络IO阻塞时,可以自动切换协程工作。(该补丁不适用于本地IO)

优点:协程任务是基于用户的,不经过操作系统,执行效率极高。
缺点:单线程执行,不能处理 CPU密集任务,和密集本地IO任务。

Python的进程、线程、协程


0人推荐
随时随地看视频
慕课网APP