php多进程编程:第一次fork
前言
使用php cli的时候,我们在终端会这样
php hello.php
运行一个hello.php程序,这样linux会为我们创建一个进程。不考虑 nohup ,在一个终端,我们以cli方式运行的php程序也只能有这一个进程。一个进程处理的任务必定是有限的,在系统资源空闲那么多的情况下,为什么不使用多进程来提高效率呢?
不过php多进程需要安装pcntl和posix扩展(windows不支持)
fork,创建子进程
创建子进程的方法就是fork,在php里面,这个函数是pcntl_fork()
pcntl_fork作用就是创建和当前进程一样的子进程,这个子进程代码段和当前进程一模一样,但是拥有自己的数据段。看一个最简单的创建子进程的方法
<?php$pid = pcntl_fork();if( $pid == -1 ){ exit("fork error");}if( $pid == 0 ){ //子进程执行pcntl_fork的时候,pid总是0,并且不会再fork出新的进程 echo "child process{$pid}\n";}else{ //父进程fork之后,返回的就是子进程的pid号,pid不为0 echo "parent process{$pid}\n";}
可以这样解释:pcntl_fork之后,系统会再次启动一个进程,重新运行当前的代码,就酱~
运行结果如下
可以看到,父进程经过pcntl_fork之后,反回了一个pid为3558,下面ps的进程号有一个3558,那就是经过fork之后的子进程啦
来看一下进程(之前我在hello.php里面sleep了几十秒,所以程序未退出)
这样,一个简单地多进程就出来了。如果要执行任务,那么就可以直接把任务的代码放到条件里面去就可以啦
守护进程介绍
1.守护进程概述
守护进程,也就是通常所说的daemon进程,是Linux中的后台服务进程。它是一个生存期较长的进程,通常独立于控制终端并且周期性地 执行某种任务或等待处理某些发生的事件。守护进程常常在系统引导载入时启动,在系统关闭时终止。Linux有很多系统服务,大多数服务都是通过守护进程实 现的。同时,守护进程还能完成许多系统任务,例如,作业规划进程crond、打印进程lqd等(这里的结尾字母d就是daemon的意思)。
由于在Linux中,每一个系统与用户进行交流的界面称为终端,每一个从此终端开始运行的进程都会依附于这个终端,这个终端称为这些进程的 控制终端,当控制终端被关闭时,相应的进程都会自动关闭。但是守护进程却能够突破这种限制,它从被执行开始运转,直到接收到某种信号或者整个系统关闭时才 会退出。如果想让某个进程不因为用户、终端或者其他的变化而受到影响,那么就必须把这个进程变成一个守护进程。可见,守护进程是非常重要的。
2.编写守护进程
编写守护进程看似复杂,但实际上也是遵循一个特定的流程,只要将此流程掌握了,就能很方便地编写出自己的守护进程。下面就分4个步骤来讲解怎样创建一个简单的守护进程。在讲解的同时,会配合介绍与创建守护进程相关的几个系统函数,希望读者能很好地掌握。
(1)创建子进程,父进程退出。这是编写守护进程的第一步。由于守护进程是脱离控制终端的,因此,完成第一步后就会在shell终端造成一 种程序已经运行完毕的假象,之后的所有工作都在子进程中完成,而用户在shell终端则可以执行其他的命令,从而在形式上做到与控制终端的脱离。
到这里,有心的读者可能会问,父进程创建了子进程后退出,此时该子进程不就没有父进程了吗?守护进程中确实会出现这么一个有趣的现象:由于 父进程已经先于子进程退出,就会造成子进程没有父进程,从而变成一个孤儿进程。在Linux中,每当系统发现一个孤儿进程时,就会自动由1号进程(也就是 init进程)收养它,这样,原先的子进程就会变成init进程的子进程。其关键代码如下:
pid = fork();if (pid > 0){ exit(0); /* 父进程退出 */}
(2)在子进程中创建新会话。这个步骤是创建守护进程最重要的一步,虽然实现非常简单,但意义却非常重大。在这里使用的是系统函数setsid(),在具体介绍setsid()之前,读者首先要了解两个概念:进程组和会话期。
进程组。进程组是一个或多个进程的集合。进程组由进程组ID来唯一标识。除了进程号(PID)之外,进程组ID也是一个进程的必备属性。
每个进程组都有一个组长进程,其组长进程的进程号等于进程组ID,且该进程ID不会因组长进程的退出而受到影响。
会话期。会话组是一个或多个进程组的集合。通常,一个会话开始于用户登录,终止于用户退出,在此期间该用户运行的所有进程都属于这个会话期。
图1 进程组和会话期之间的关系
接下来就可以具体介绍setsid()
的相关内容。
setsid()函数的作用。setsid()函数用于创建一个新的会话组,并担任该会话组的组长。调用setsid()有以下3个作用:
让进程摆脱原会话的控制。
让进程摆脱原进程组的控制。
让进程摆脱原控制终端的控制。
那么,在创建守护进程时为什么要调用setsid()函数呢?读者可以回忆一下创建守护进程的第一步, 在那里调用了fork()函数来创建子进程再令父进程退出。由于在调用fork()函数时,子进程全盘复制了父进程的会话期、进程组和控制终端等,虽然父 进程退出了,但原先的会话期、进程组和控制终端等并没有改变,因此,还不是真正意义上的独立。而setsid()函数能够使进程完全独立出来,从而脱离所 有其他进程的控制。
setsid()函数格式。表1列出了setsid()函数的语法要点。
表1 setsid()函数语法要点
所需头文件
?
12 | # include <sys/types.h> # include <unistd.h> |
函数原型 pid_t setsid(void)
函数返回值 成功:该进程组ID
出错:-1
(3)改变当前目录为根目录。这一步也是必要的步骤。使用fork()创建的子进程继承了父进程的当前工作目录。由于在进程运行过程中,当 前目录所在的文件系统(如“/mnt/usb”等)是不能卸载的,这对以后的使用会造成诸多的麻烦(如系统由于某种原因要进入单用户模式)。因此,通常的 做法是让“/”作为守护进程的当前工作目录,这样就可以避免上述问题。当然,如有特殊需要,也可以把当前工作目录换成其他的路径,如/tmp。改变工作目 录的常见函数是chdir()。
(4)重设文件权限掩码。文件权限掩码是指屏蔽掉文件权限中的对应位。例如,有一个文件权限掩码是050,它就屏蔽了文件组拥有者的可读与 可执行权限。由于使用fork()函数新建的子进程继承了父进程的文件权限掩码,这就给该子进程使用文件带来了诸多的麻烦。因此,把文件权限掩码设置为 0,可以大大增强该守护进程的灵活性。设置文件权限掩码的函数是umask()。在这里,通常的使用方法为umask(0)。
(5)关闭文件描述符。同文件权限掩码一样,用fork()函数新建的子进程会从父进程那里继承一些已经打开的文件。这些被打开的文件可能永远不会被守护进程读或写,但它们一样消耗系统资源,而且可能导致所在的文件系统无法被卸载。
用php编写守护进程
在此之前,需要知道守护进程这个概念,知道之后,才可以用php来编写守护进程。那么创建守护进程需要有下面这几个步骤。
1.创建子进程,父进程退出
父进程先与子进程退出,子进程则会被1号进程收养,这个子进程就会成为init的子进程
php使用pcntl_fork()来创建子进程。
pcntl_fork()返回一个整型值,在父进程里面返回的是子进程的id,子进程返回的是0,失败则返回-1。这样我们就可以根据这个来分别控制父进程和子进程执行任务。
2.子进程创建会话
这个是重要的一步,在这一步中该子进程会做这些事情:1.让进程摆脱原会话的控制;2.让进程摆脱员进程组的控制;3.让进程摆脱终端的控制。
为什么要这样?这个在守护进程介绍里面有
php这里使用posix_setsid()来在这个子进程中创建会话,使得这个进程成为会话组组长
通过这两步骤就可以创建一个守护进程了。如果多需要多进程,那么只需要在这个守护进程fork子进程就可以。
那么有这两个步骤,就可以开始写代码了。
<?php
function children(){
posix_setsid();
sleep(100);
}
$pid = pcntl_fork();
//fork失败pid为-1
if( $pid == -1 ){
exit('fork error');
}
//pid为0为子进程执行的部分
if( $pid == 0 ){
children();
}else{
//这里是父进程执行的部分,直接退出
exit('parent exit');
}
?>
的代码什么也没干,只是创建了一个什么也不干的守护进程,想干点什么,那么可以在children里面去写吧,既然是守护进程,那么我们一般用来再次fork子进程来干活。
<?php
/**
* 需要进行的作业
*/
function worker(){
$pid = pcntl_fork();
if( $pid == -1 ){
exit('fork error');
}
if( $pid == 0 ){
for( $i=0;$i<50;$i++ ){
file_put_contents("log","hello {$i}\n",FILE_APPEND);
sleep(1);
}
}
}
/**
* 子进程
*/
function children(){
$sid = posix_setsid();
echo $sid;
for( $i=0;$i<2;$i++ ){
worker();
}
sleep(100);
}
$pid = pcntl_fork();
if( $pid == -1 ){
exit('fork error');
}
if( $pid == 0 ){
children();
}else{
exit('parent exit');
}
?>
上面的代码就是子进程再次fork两个子进程来执行任务。是没隔1s向log里面写入一行文字。
上面的代码中,在children进程我们称之为master进程,下面有两个worker进程。函数里面使用了sleep(100)是为了不让master进程马上就退出,如果该进程退出了,那么这个进程下面的子进程则又会成为孤儿进程。
实际过程中,肯定不能使用sleep()函数不让master进程退出的,需要使用pcntl_wait($status,WUNTRACED);来等待子进程的信号。