Linux服务器项目-3
Linux多进程开发:
2.1进程概述
程序是包含一系列信息的文件,这些信息描述了如何在运行时创建一个进程:这些信息又包括二进制格式标识,机器语言指令,程序入口地址,数据,符号表及重定位表,共享库和动态链接信息,其他信息。
进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。
可以用一个程序来创建多个进程,进程是由内核定义的抽象实体,并为该实体分配用以执行程序的各项系统资源。从内核的角度看,进程由用户内存空间和一系列内核数据结构组成。
单道程序:计算机内存只能运行一个程序。
多道程序:计算机内存可以存放几个相互独立的程序,它们之间穿插运行。对于一个单 CPU 系统来说,==程序同时处于运行状态只是一种宏观上的概念==,他们虽然都已经开始运行,但就微观而言,任意时刻, CPU 上运行的程序只有一个。
2.1.1 时间片:又称为“量子 (quantum) ”或“处理器片 processor slice
是操作系统分配给每个正在运行的进程微观上的一段 CPU 时间。时间片太短或太长都会使CPU利用率下降。
时间片由操作系统内核的调度程序分配给每个进程。首先,内核会给每个进程分配相等的初始时间片,然后每个进程轮番地执行相应的时间,当所有进程都处于时间片耗尽的状态时,内核会重新为每个进程计算并分配时间片,如此往复。
2.1.2 并行和并发:
并行 ( parallel):指在同一时刻,有多条指令在多个处理器上同时执行。
并发 ( concurrency):指在同一时刻只能有一条指令执行,但多个进程指令被快速的轮换执行,使得在宏观上具有多个进程同时执行的效果,但在微观上并不是同时执行的,只是把时间分成若干段,使多个进程快速交替的执行。

2.1.3 进程控制块(PCB):
为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个 PCB(Processing Control Block) 进程控制块,维护进程相关的信息。Linux 内核的进程控制块是 task_struct 结构体。
其内部的成员函数有很多,需要主要掌握的有:
- 进程 id :系统中每个进程有唯一的 id ,用 pid_t 类型表示,其实就是一个非负整数
- 进程的状态:有就绪、运行、挂起、停止等状态
- 进程切换时需要保存和恢复的一些 CPU 寄存器
- 描述虚拟地址空间的信息
- 描述控制终端的信息
- 当前工作目录 (Current Working Directory)
- umask 掩码
- 文件描述符表,包含很多指向 file 结构体的指针
- 和信号相关的信息
- 用户 id 和组 id
- 会话( Session )和进程组
- 进程可以使用的资源上限(Resource Limit)
ulimit -a命令可以显示当前系统资源的上限
2.2 进程状态转换
进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中,进程状态分为三个基本状态,即就绪态,运行态,阻塞态。在五态模型中,进程分为新建态、就绪态,运行态,阻塞态,终止态。


- 运行态:进程占有处理器正在运行
- 就绪态:进程具备运行条件,等待系统分配处理器以便运行。当进程已分配到除 CPU 以外的所有必要资源后,只要再获得 CPU ,便可立即执行。在一个系统中处于就绪状态的进程可能有多个,通常将它们排成一个队列,称为就绪队列
- 阻塞态:又称为等待态或睡眠态,指进程不具备运行条件,正在等待某个事件的完成
- 新建态:进程刚被创建时的状态,尚未进入就绪队列
- 终止态:进程完成任务到达正常结束点,或出现无法克服的错误而异常终止,或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行,但依然保留在操作系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后,操作系统将删除该进程。
查看进程:ps aux / ajx,通过tty指令可以查看当前终端
- a:显示终端上的所有进程,包括其他用户的进程
- u:显示进程的详细信息
- x:显示没有控制终端的进程
- j:列出与作业控制相关的信息
输出了以下的信息:
1 | 用户 进程ID CPU占有率 内存占有率 当前所属终端 进程状态 ps aux |
实时显示进程状态,top命令:可以在使用top 命令时加上 d 来指定显示信息更新的时间间隔,在 top 命令执行后,可以按以下按键对显示的结果进行排序:
- M 根据内存使用量排序
- P 根据 CPU 占有率排序
- T 根据进程运行时间长短排序
- U 根据用户名来筛选进程
- K 输入指定的 PID 杀死进程
杀死进程,kill命令:
- kill [signal] pid
- kill -l 列出所有信号
- kill -SIGKILL 进程 ID(sigkill是序号为9的一个宏)
- kill -9 进程 ID
- killall name 根据进程名杀死进程
进程号和相关函数:
每个进程都由进程号来标识,其类型为 pid_t (整型),进程号的范围 0 ~ 32767 。进程号总是唯一的,但可以重用。当一个进程终止后,其进程号就可以再次使用。
任何进程(除 init 进程)都是由另一个进程创建,该进程称为被创建进程的父进程,对应的进程号称为父进程号(PPID)。
进程组是一个或多个进程的集合。他们之间相互关联,进程组可以接收同一终端的各种信号,关联的进程有一个进程组号( PGID )。默认情况下,当前的进程号会当做当前的进程组号。
相关的函数:
1 | 进程号和进程组相关函数: |
2.3 创建进程
系统允许一个进程创建一个新进程,新进程即为子进程,子进程还可以创建新的子进程,形成树形结构。
pid_t fork(void);通过fork创建子进程,fork返回值一个在父进程中,一个在子进程中。
子进程相当于对父进程进行了复制,其代码部分都是一样的,但是fork函数会返回不同的PID号,这样可以将父进程和子进程区分开。两者之间互不影响,比如修改父进程中的一个元素的值不能影响子进程。采用读时复制,写时共享的机制,为了节约内存的使用,降低拷贝内存需要的时间。子进程结束后,父进程要回收其资源
Linux 进程共享(读时共享 写时复制)是什么_年年年年年的博客-CSDN博客_读时共享
1 | /* |
GDB多进程调试:
GDB只能追踪一个进程,默认追踪父进程。
设置调试父进程或者子进程:set follow-fork-mode [parent (默认 )|child],通过show follow-fork-mode 可以查看调试的是父进程还是子进程
设置调试模式:set detach-on-fork [on | off];默认为on ,表示调试当前进程的时候,其它的进程继续运行,如果为 off ,调试当前进程的时候,其它进程被 GDB 挂起。
查看调试的进程:info inferiors
切换当前调试的进程:inferior id
使进程脱离GDB 调试: detach inferiors id,程序就会继续向下执行。
测试程序:
1 |
|
2.4 exec函数族
类似于C++中的函数重载,exec 函数族的作用是根据指定的文件名找到可执行文件,并用它来取代调用进程的内容,换句话说,就是在调用进程内部执行一个可执行文件。exec 函数族的函数执行成功后不会返回,而会继续向下执行,执行失败会返回-1.
1 | //C库中的函数,execl, execlp用的最多 |
执行exec函数族中的函数就不会再执行进程中的其他内容了。
execl函数:
1 | /* |
execlp函数:
1 | /* |
2.5 进程退出,孤儿进程,僵尸进程
进程退出:
1 |
|
实际上我们写程序常用的return 0也是代表程序退出,这点与exit()函数是相同的。
1 | /* |
孤儿进程:父进程运行结束,但子进程还在运行(未运行结束),这样的子进程就称为孤儿进程(Orphan Process )每当出现一个孤儿进程的时候,内核就把孤儿进程的父进程设置为 init,也就是pid为1的进程,而 init
进程会循环地 wait() 它的已经退出的子进程。子进程结束后,init进程回收子进程的资源。
1 |
|
僵尸进程:每个进程结束之后 , 都会释放自己地址空间中的用户区数据,内核区的 PCB 没有办法自己释放掉,需要父进程去释放。进程终止时,父进程尚未回收,子进程残留资源( PCB )存放于内核中,变成僵尸进程。
僵尸进程不能被 kill 9 杀死,这样就会导致一个问题,如果父进程不调用wait()或 waitpid() 的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果大量的产生僵尸进程,将因为没有可用的进程号而导致系统不能产生新的进程,此即为僵尸进程的危害,应当避免。实际上就是父进程一直运行,子进程运行完了。
1 |
|
wait 和 waitpid 函数
父进程可以通过调用 wait 或 waitpid 得到它的退出状态同时彻底清除掉这个进程,回收子进程的资源。
wait() 和 waitpid() 函数的功能一样,区别在于, wait() 函数会阻塞,waitpid() 可以设置不阻塞, waitpid() 还可以指定等待哪个子进程结束。一个函数只能回收一个子进程。实际上就是让父进程先别运行了,先停停,先阻塞一下把子进程都回收完了自己再运行把!
wait()函数的使用:
1 | /* |
waitpid()函数的使用:
默认的进程组的ID就是父进程的ID。
1 | /* |