Linux服务器项目-6
第三章:多线程开发:
3.1 线程概述
与进程(process )类似,线程 (thread)是允许应用程序并发执行多个任务的一种机制。一个进程可以包含多个线程。同一个程序中的所有线程均会独立执行相同程序,且共享同一份全局内存区域,其中包括初始化数据段、未初始化数据段,以及堆内存段。(传统意义上的 UNIX 进程只是多线程程序的一个特例,该进程只包含一个线程)
并发是一个宏观意义上的概念,实际上不可能两个程序同时运行,只是切换速度很快,让人们感觉在并发。这点与并行不同,并行必须要多个CPU才行。
进程是 CPU 分配资源的最小单位,线程是操作系统调度执行的最小单位。
线程是轻量级的进程( LWP Light Weight Process ),在 Linux 环境下线程的本质仍是进程。
查看指定进程的 LWP 号: ps -Lf pid
,通过这个我们可以看到系统的同一个进程中有多线程。
线程和进程的区别:
- 进程间的信息难以共享。由于除去只读代码段外,父子进程并未共享内存,因此必须采用一些进程间通信方式,在进程间进行信息交换。
- 调用 fork() 来创建进程的代价相对较高,即便利用写时复制技术,仍然需要复制诸如内存页表和文件描述符表之类的多种进程属性,这意味着 fork() 调用在时间上的开销依然不菲。
- 线程之间能够方便、快速地共享信息。只需将数据复制到共享(全局或堆)变量中即可。
- 创建线程比创建进程通常要快 10 倍甚至更多。线程间是共享虚拟地址空间的,无需采用写时复制来复制内存,也无需复制页表。
线程之间的共享资源和非共享资源:
- 共享资源:进程 ID 和父进程 ID;进程组 ID 和会话 ID;用户 ID 和 用户组 ID;文件描述符表;(这些都是位于系统内核中) 信号处置;文件系统的相关信息:文件权限掩码umask )、当前工作目录;虚拟地址空间(除栈、 .text(代码段))
- 非共享资源:线程 ID;信号掩码;线程特有数据;error 变量;实时调度策略和优先级;栈,本地变量和函数的调用链接信息
查看当前 pthread 库版本: getconf GNU_LIBPTHREAD_VERSION
线程操作相关的API:
1 | pthread_t pthread_self(void); |
编译线程相关的程序需要加上-pthread
,因为系统没有这个库,相当于-lpthread
,pthread是一个动态库。
线程的创建:
1 | /* |
线程退出:
1 | /* |
和终止的线程进行连接:pthread_join
,主要为了回收子线程的资源。
1 | /* |
分离一个线程:pthread_detach
1 | /* |
线程取消:
1 | /* |
线程属性:
1 | /* |
3.2 线程同步
一个卖票的例子,三个线程买票:
1 | /* |
线程的主要优势在于,能够通过全局变量来共享信息。不过,这种便捷的共享是有代价的:必须确保多个线程不会同时修改同一变量,或者某一线程不会读取正在由其他线程修改的变量。
临界区是指访问某一共享资源的代码片段,并且这段代码的执行应为原子操作,也就是同时访问同一共享资源的其他线程不应终端该片段的执行,保证数据的安全性。
线程同步:即当有一个线程在对内存进行操作时,其他线程都不可以对这个内存地址进行操作,直到该线程完成操作,其他线程才能对该内存地址进行操作,而其他线程则处于等待状态。线程同步可以通过互斥量(互斥锁)实现。
为避免线程更新共享变量时出现问题,可以使用互斥量( mutex 是 mutual exclusion的缩写)来确保同时仅有一个线程可以访问某项共享资源。可以使用互斥量来保证对任意共享资源的原子访问,保证线程同步,
互斥量有两种状态:已锁定( locked )和未锁定( unlocked )。任何时候,至多只有一个线程可以锁定该互斥量。试图对已经锁定的某一互斥量再次加锁,将可能阻塞线程或者报错失败,具体取决于加锁时使用的方法。
一旦线程锁定互斥量,随即成为该互斥量的所有者,只有所有者才能给互斥量解锁。一般情况下,对每一共享资源(可能由多个相关变量组成)会使用不同的互斥量,每一线程在访问同一资源时将采用如下协议:
- 针对共享资源锁定互斥量
- 访问共享资源
- 对互斥量解锁
如果多个线程试图执行这一块代码(一个临界区),事实上只有一个线程能够持有该互斥量(其他线程将遭到阻塞),即同时只有一个线程能够进入这段代码区域,如下图所示:
1 | //互斥量的类型 pthread_mutex_t |
使用互斥量可以有效解决线程间冲突的问题。临界区执行的时候加上互斥量,结束后解除互斥量。
1 | /* |
使用互斥量可能会出现的问题:死锁
有时,一个线程需要同时访问两个或更多不同的共享资源,而每个资源又都由不同的互斥量管理。当超过一个线程加锁同一组互斥量时,就有可能发生死锁,比如下面的例子。
两个或两个以上的进程在执行过程中,因争夺共享资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁。
产生死锁的几种场景:忘记释放锁;重复加锁(比如一个a函数加锁M,函数中调用b函数也加锁M);多进程多锁,抢占锁资源,比如下面这个图。
当有一个线程已经持有互斥锁时,互斥锁将所有试图进入临界区的线程都阻塞住。但是考虑一种情形,当前持有互斥锁的线程只是要读访问共享资源,而同时有其它几个线程也想读取这个共享资源,但是由于互斥锁的排它性,所有其它线程都无法获取锁,也就无法读访问共享资源了,但是实际上多个线程同时读访问共享资源并不会导致问题。
在对数据的读写操作中,更多的是读操作,写操作较少,例如对数据库数据的读写应用。为了满足当前能够允许多个读出,但只允许一个写入的需求,线程提供了读写锁来实现。
读写锁的特点:
- 如果有其它线程读数据,则允许其它线程执行读操作,但不允许写操作。
- 如果有其它线程写数据,则其它线程都不允许读、写操作。
- 写是独占的,写的优先级高。
读写锁相关操作函数:
1 | //读写锁的类型 pthread_rwlock_t |
读写锁的例子,读的时候不会阻塞,可以并发执行
1 | /* |
生产者,消费者模型:包括生产者,消费者和容器
程序出现段错误,核心已转储这种类似的问题是,可以通过查看core文件寻找错误。
首先ulimit -a
查看信息,将core文件的大小设置为非0;然后重新编译程序,编译时加上-g
;最后通过gdb输入core-file core
可以查看错误信息。
条件变量:pthread_cond_t
,某个条件满足后阻塞线程,或者某个条件满足后解除阻塞。配合互斥量使用,维持线程同步,条件变量不能解决数据量混乱的问题,互斥量才可以。
1 | //条件变量的类型 pthread_cond_t |
生产者消费者结合条件变量的实现
1 | /* |
信号量:用于阻塞线程,和条件变量的作用差不多,但是岂有可用和不可用两种状态。是在多线程环境下使用的一种设施,是可以用来保证两个或多个关键代码段不被并发调用。在进入一个关键代码段之前,线程必须获取一个信号量;一旦该关键代码段完成了,那么该线程必须释放信号量。其它想进入该关键代码段的线程必须等待直到第一个线程释放信号量。
在停车场系统中,车位是公共资源,每辆车好比一个线程,看门人起的就是信号量的作用。
1 | //信号量的类型 sem_t |
信号量实现生产者消费者模型:
1 | /* |