目录
1. 进程创建
1.1 fork函数初识
1.2 fork返回值
1.3 写时拷贝
1.4 fork常规用法
1.5 fork调用失败的原因
2. 进程终止
2.1 进程退出场景
2.2 进程常见退出方法
2.2-1 进程退出码
2.2-2 _exit函数
2.2-3 exit函数
2.2-4 return退出
3. 进程等待
3.1 进程等待必要性
3.2 进程等待的方法
3.2-1 wait方法
3.2-2 waitpid方法
3.2-3 获取子进程status
1. 进程创建
1.1 fork函数初识
在linux中fork函数是⾮常重要的函数,它从已存在进程中创建⼀个新进程。新进程为⼦进程,而原进程为父进程。
#include <unistd.h>
pid_t fork(void);
返回值:⾃进程中返回0,⽗进程返回⼦进程id,出错返回-1
进程调⽤fork,当控制转移到内核中的fork代码后,内核做:
• 分配新的内存块和内核数据结构给⼦进程。
• 将⽗进程部分数据结构内容拷贝至⼦进程。
• 添加⼦进程到系统进程列表当中。
• fork返回,开始调度器调度 。
当⼀个进程调⽤fork之后,就有两个⼆进制代码相同的进程。⽽且它们都运⾏到相同的地⽅。但每个进程都将可以开始它们⾃⼰的旅程,看如下程序。
int main( void )
{
pid_t pid;
printf("Before: pid is %d\n", getpid());
if ( (pid=fork()) == -1 )perror("fork()"),exit(1);
printf("After:pid is %d, fork return %d\n", getpid(), pid);
sleep(1);
return 0;
}
运⾏结果:
[root@localhost linux]# ./a.out
Before: pid is 43676
After:pid is 43676, fork return 43677
After:pid is 43677, fork return 0
这⾥看到了三⾏输出,⼀⾏before,两⾏after。进程43676先打印before消息,然后它有打印after。另⼀个after消息有43677打印的。注意到进程43677没有打印before,为什么呢?如下图所示:
所以,fork之前⽗进程独⽴执⾏,fork之后,⽗⼦两个执⾏流分别执⾏。注意,fork之后,谁先执⾏完全由调度器决定。
1.2 fork返回值
• ⼦进程返回0,
• ⽗进程返回的是⼦进程的pid。
1.3 写时拷贝
通常,⽗⼦代码共享,父子再不写⼊时,数据也是共享的,当任意⼀⽅试图写⼊,便以写时拷⻉的⽅式各⾃⼀份副本。具体⻅下图:
那么写时拷贝是如何发生的呢?
答:“系统将父进程页表的数据段和代码段设为了只读,当子进程试图修改数据段的数据,系统就会报错,通过区域划分确认子进程要修改的是数据段的数据,这就导致虽然不允许子进程修改父进程的数据,但是由于是数据段,符合写时拷贝的条件,所以才发生了写时拷贝。
因为有写时拷⻉技术的存在,所以⽗⼦进程得以彻底分离离!完成了进程独⽴性的技术保证!
写时拷⻉,是⼀种延时申请技术,可以提⾼整机内存的使⽤率。
1.4 fork常规用法
• ⼀个⽗进程希望复制⾃⼰,使⽗⼦进程同时执⾏不同的代码段。例如,⽗进程等待客户端请求,
⽣成⼦进程来处理请求。
• ⼀个进程要执⾏⼀个不同的程序。例如⼦进程从fork返回后,调⽤exec函数。
1.5 fork调用失败的原因
• 系统中有太多的进程
• 实际用户的进程数超过了限制
无论是进程太多还是用户太多本质上都是内存不足引起的。
2. 进程终止
进程终⽌的本质是释放系统资源,就是释放进程申请的相关内核数据结构和对应的数据和代码。
2.1 进程退出场景
• 代码运完毕,结果正确。
代码正常运行,得到了我们想要的结果。
• 代码运行完毕,结果不正确。
代码正常运行,没有得到我们想要的结果。
• 代码异常终止。
程序因为野指针,常数除0等情况异常中止。
我们在前面章节讲过,main是被其他函数调用的,因为它有返回类型和返回值。那么它的返回值代码什么呢?main函数如果正常运行,结果达到预期则返回0,如果正常运行,结果没有达到预期则返回非0,用不同的值来表示不同的错误,这种值叫做进程退出码。进程运行有没有错误,由进程退出码决定。
2.2 进程常见退出方法
正常终止(可以通过 echo $? 查看进程退出码):
1. 从main返回
2. 调⽤exit
3. _exit
echo $?命令:打印最近一个程序(进程)退出时的退出码。
异常退出:
• ctrl + c,信号终止,退出码无意义。
2.2-1 进程退出码
退出码(退出状态)可以告诉我们最后⼀次执⾏的命令的状态。在命令结束以后,我们可以知道命令是成功完成的还是以错误结束的。其基本思想是,程序返回退出代码 0 时表⽰执⾏成功,没有问题。代码 1 或 0 以外的任何代码都被视为不成功。
Linux Shell 中的主要退出码:
• 退出码 0 表⽰命令执⾏⽆误,这是完成命令的理想状态。
• 退出码 1 我们也可以将其解释为 “不被允许的操作”。例如在没有 sudo 权限的情况下使⽤
yum;再例如除以 0 等操作也会返回错误码 1 ,对应的命令为 let a=1/0
• 130 ( SIGINT 或 ^C )和 143 ( SIGTERM )等终⽌信号是⾮常典型的,它们属于
128+n 信号,其中 n 代表终⽌码。
• 可以使⽤strerror函数来获取退出码对应的描述。
执行这个c语言程序,我们来查看一部分错误信息描述:
2.2-2 _exit函数
#include <unistd.h>
void _exit(int status);
参数:status 定义了进程的终⽌状态,⽗进程通过wait来获取该值
说明:虽然status是int,但是仅有低8位可以被⽗进程所⽤。所以_exit(-1)时,在终端执⾏$?发现
返回值是255。
2.2-3 exit函数
#include <unistd.h>
void exit(int status);
任何地方调用exit,都表示进程结束,并返回子进程的退出码给父进程bash。exit函数以后的值不会执行,如果函数有返值,也不会返回。
问题:缓冲区在哪里?或者一定不在哪里?
答:”一定不在操作系统内部,如果在操作系统内部,那么这两个函数是都应该进行缓冲区的刷新,但是只有exit函数进行了刷新。缓冲区在语言层提供的缓冲区中!
库函数与系统调用是上层与下层的关系,能结束进程的也只有操作系统,所以exit最后也会调⽤_exit, 但在调⽤_exit之前,还做了其他工作:
1. 执⾏用户通过 atexit或on_exit定义的清理函数。
2. 关闭所有打开的流,所有的缓存数据均被写⼊。
3. 调用_exit。
实例:
int main()
{
printf("hello");
exit(0);
}
运⾏结果:
[root@localhost linux]# ./a.out
hello[root@localhost linux]#
int main()
{
printf("hello");
_exit(0);
}
运⾏结果:
[root@localhost linux]# ./a.out
[root@localhost linux]#
2.2-4 return退出
return是⼀种更常见的退出进程⽅法。执⾏return n等同于执⾏exit(n),因为调⽤main的运⾏时函数会将main的返回值当做 exit的参数。
3. 进程等待
3.1 进程等待必要性
• 之前讲过,⼦进程退出,⽗进程如果不管不顾,就可能造成‘僵⼫进程’的问题,进⽽造成内存
泄漏。
• 另外,进程⼀旦变成僵⼫状态,那就刀枪不⼊,“杀⼈不眨眼”的kill -9 也⽆能为⼒,因为谁也
没有办法杀死⼀个已经死去的进程。
• 最后,⽗进程派给⼦进程的任务完成的如何,我们需要知道。如,子进程运⾏完成,结果对还是
不对,或者是否正常退出。
• ⽗进程通过进程等待的⽅式,回收⼦进程资源,获取子进程退出信息。
3.2 进程等待的方法
3.2-1 wait方法
#include<sys/types.h>
#include<sys/wait.h>
pid_t wait(int* status);
返回值:
成功返回被等待进程pid,失败返回-1。
参数:
输出型参数,获取⼦进程退出状态,不关⼼则可以设置成为NULL
如果等待子进程,子进程没有退出,父进程会阻塞在wait调用处(像scanf一样)。
pid_ t waitpid(pid_t pid, int *status, int options);
返回值:
当正常返回的时候waitpid返回收集到的⼦进程的进程ID;
如果设置了选项WNOHANG,⽽调⽤中waitpid发现没有已退出的⼦进程可收集,则返回0;
如果调⽤中出错,则返回-1,这时errno会被设置成相应的值以指⽰错误所在;
参数:
pid:
Pid=-1,等待任⼀个⼦进程。与wait等效。
Pid>0.等待其进程ID与pid相等的⼦进程。
status: 输出型参数
WIFEXITED(status): 若为正常终⽌⼦进程返回的状态,则为真。(查看进程是
否是正常退出)
WEXITSTATUS(status): 若WIFEXITED⾮零,提取⼦进程退出码。(查看进程的
退出码)
options:默认为0,表⽰阻塞等待
WNOHANG: 若pid指定的⼦进程没有结束,则waitpid()函数返回0,不予以等
待。若正常结束,则返回该⼦进程的ID。
• 如果⼦进程已经退出,调⽤wait/waitpid时,wait/waitpid会⽴即返回,并且释放资源,获得⼦
进程退出信息。
• 如果在任意时刻调⽤wait/waitpid,⼦进程存在且正常运⾏,则进程可能阻塞。
• 如果不存在该⼦进程,则⽴即出错返回。
3.2-2 waitpid方法
pid_ t waitpid(pid_t pid, int *status, int options);
返回值:
当正常返回的时候waitpid返回收集到的⼦进程的进程ID;
如果设置了选项WNOHANG,⽽调⽤中waitpid发现没有已退出的⼦进程可收集,则返回0;
如果调⽤中出错,则返回-1,这时errno会被设置成相应的值以指⽰错误所在;
参数:
pid:
Pid=-1,等待任⼀个⼦进程。与wait等效。
Pid>0.等待其进程ID与pid相等的⼦进程。
status: 输出型参数
WIFEXITED(status): 若为正常终⽌⼦进程返回的状态,则为真。(查看进程是
否是正常退出)
WEXITSTATUS(status): 若WIFEXITED⾮零,提取⼦进程退出码。(查看进程的
退出码)
options:默认为0,表⽰阻塞等待
WNOHANG: 若pid指定的⼦进程没有结束,则waitpid()函数返回0,不予以等
待。若正常结束,则返回该⼦进程的ID。
• 如果⼦进程已经退出,调⽤wait/waitpid时,wait/waitpid会⽴即返回,并且释放资源,获得⼦
进程退出信息。
• 如果在任意时刻调⽤wait/waitpid,⼦进程存在且正常运⾏,则进程可能阻塞。
• 如果不存在该⼦进程,则⽴即出错返回。
3.2-3 获取子进程status
• wait和waitpid,都有⼀个status参数,该参数是⼀个输出型参数,由操作系统填充。
• 如果传递NULL,表示不关心⼦进程的退出状态信息。
• 否则,操作系统会根据该参数,将⼦进程的退出信息反馈给⽗进程。
• status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16
⽐特位):
我们运行一个程序:
该程序退出,那么它的退出码(status)应该为1,但是我们来看结果:
它的退出码竟然为256,是的,从我们上述可知,我们只研究status的低16位。其中这16位的高八位存储了退出码,所以我们可以像这样:
拿到status之后只取它的低16位中的高八位 ,就能得到它真正的退出码,我们将它的退出码改为10:
#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
int main( void )
{
pid_t pid;
if ( (pid=fork()) == -1 )
perror("fork"),exit(1);
if ( pid == 0 ){
sleep(20);
exit(10);
} else {
int st;
int ret = wait(&st);
if ( ret > 0 && ( st & 0X7F ) == 0 ){ // 正常退出
printf("child exit code:%d\n", (st>>8)&0XFF);
} else if( ret > 0 ) { // 异常退出
printf("sig code : %d\n", st&0X7F );
}
}
}
测试结果:
# ./a.out #等20秒退出
child exit code:10
# ./a.out #在其他终端kill掉
sig code : 9
果然,我们拿到了它的退出码。
而剩下八位的低七位,存放的是信号编号,信号是什么呢?在程序异常中止时,系统就会收到信号。(1)这低七位默认为0,表示没有异常。(2)一旦退出信号不为0,我们的程序是异常退出的,那么退出码将无意义!因为只要程序异常,我们程序的代码就一定没有执行完毕,退出码当然也就没有意义了。要获得异常退出信号,只需要拿到status的最后七位:
来看结果:
程序正常结束,异常退出信号果然为0。
那么子进程退出的退出码和信号放到了哪里呢?
子进程退出之前会把退出信息放到自己的PCB中,退出码和信号也放到了PCB中,父进程只需要查看子进程的PCB就能获取子进程的各种退出信息。
本章完。