1、管道
我们了解到进程是独立的,但有时进程间需要进行通信。那么,如何实现进程间的通信呢?
进程间通过文件的内核缓冲区实现资源共享,这个过程无需磁盘参与,因此设计了一种内存级的文件来专门实现进程间通信,这种内存级文件就是管道。管道是什么?
管道是unix中最古老的进程间通信形式,从一个进程连接到另一个进程的数据流称为“管道”。管道的原理:
必须先打开文件,然后创建子进程,不能先创建子进程再打开文件。这个过程利用的是子进程会继承父进程相关资源的特性。
为什么父进程在打开文件时必须以“读写”方式打开,不能只读或只写?因为父进程打开文件,创建子进程后,父子进程必须有一个写,一个读,不能两个都读或两个都写。管道不需要路径,也就不需要名字,所以称为匿名管道。
上面的操作只是让父子进程看到了同一份资源,但还没有实现通信。这个内存资源由操作系统提供,因此进程间通信也应通过操作系统实现,即调用系统调用。
#include <iostream> #include <unistd.h> #include <sys/types.h> #include <sys/wait.h> using namespace std; int main(){ //1、创建管道 int fds[2] = {0}; int n = pipe(fds); if (n != 0) { cerr << "pipe error" << endl; return -1; } //2、创建子进程 pid_t id = fork(); if (id < 0) { cerr << "fork error" << endl; return -1; } else if (id == 0) { //子进程 //3、关闭不需要的fd close(fds[0]);//0是读 int cnt = 0; while (true) { string message = "hello world, hello "; message += to_string(getpid()); message += ", "; message += to_string(cnt++); write(fds[1], message.c_str(), message.size()); sleep(1); } exit(0); } else { //父进程 close(fds[1]);//1是写 char buffer[1024]; while (true) { ssize_t n = read(fds[0], buffer, 1024); if (n > 0) { buffer[n] = 0; cout << "father, message: " << buffer << endl; } } } return 0; }
子进程写,父进程读。看待父子进程就像看待文件一样。在上面子进程sleep的过程中,父进程在做什么呢?在阻塞等待。父进程在读完子进程的数据后,操作系统就不让父进程读了,让其进入阻塞状态,等待子进程再次写入。这是为了保护共享资源,防止子进程写了一半父进程就读,或者父进程读了一半子进程就写。这个过程是管道内部自动完成的。
现象:
管道为空且管道正常,read会阻塞(read是一个系统调用)。管道为满(管道资源是有限的)且管道正常,write会阻塞。管道写端关闭且读端继续,读端读到0,表示读到文件结尾。管道读端关闭且写端继续,操作系统会终止写入的进程。
特性:
面向字节流。不关心对面是如何写的,按需读取。用来进行具有血缘关系的进程进行IPC,常用于父子进程。文件的生命周期随进程,管道也是。单向数据通信。管道自带同步互斥等保护机制。
2、进程池退出
当关闭写端,读端读到0,表示读到文件结尾,则结束进程。即将父进程所有的读端关闭,则相应的子进程就会结束,最后再由父进程等待回收。
void CleanProcessPool(){ //virsion1 for (auto &c : _channels) { c.Close(); } for (auto &c : _channels) { pid_t rid = waitpid(c.GetId(), nullptr, 0); if (rid > 0) { cout << "child " << rid << " exit" << endl; } } }
为什么要分开关闭读端和等待子进程,不能关一个等一个吗?
根据上面的分析,所有的子进程的file_struct都会指向第一个管道,越往后的子进程指向的管道越多。所以我们只是把master的file_struct中指向管道关闭,这个管道还有其他子进程的file_struct指向,因此读端不会读到0,子进程不会退出,就会一直阻塞。解决这个问题有两种办法:
1、倒着关闭 因为通过分析可知,越早创建的管道指向越多,最后一个管道只被指向一次,只要将最后一个进程关闭,则前面的所有管道被指向都会少1,因此倒着关闭就不会出现阻塞的问题。
//virsion2 for (int i = _channels.size()-1; i >= 0; i--) { _channels[i].Close(); pid_t rid = waitpid(_channels[i].GetId(), nullptr, 0); if (rid > 0) { cout << "child " << rid << " exit" << endl; } }
2、在子进程中关闭所有历史fd 因为父进程的3号文件描述符总为空,子进程只有3号文件描述符指向管道。在这之前子进程继承父进程对之前的管道的指向,所以只需要在子进程中把这些指向全部关掉就行。
// 3、建立通信信道 if (id == 0) { //关闭历史fd for (auto &c : _channels) { c.Close(); } // 子进程 //close(pipefd[1]); //dup2(pipefd[0], 0); // 子进程从标准输入读取 //_work(); //exit(0); }
3、命名管道
我们知道,匿名管道的原理是让父子进程看到同一份资源,而父子进程看到同一份资源,是因为子进程继承了父进程的资源。所以不难得出,匿名管道两端必须是父子进程。而如果我们想在任意进程之间建立管道呢?首先可以肯定的是这任意两个进程之间也要能看到同一份资源,因为是任意进程之间,所以这个资源不能继承而来,因此就牵扯出了命名管道。
命名管道的原理:为什么叫做命名管道,因为有名字,是真实存在的文件,既然是真实存在的文件,就一定有路径+文件名,而路径+文件名具有唯一性。这样不同的进程可以用同一个文件系统路径标志同一个资源,也就是不同的进程看到了同一个资源。命名管道和普通文件的区别:这么看来命名管道和普通文件好像除了创建方式不同外也没多大区别,而普通文件好像也能实现进程间通信,但是普通文件有两个问题,我们往普通文件中写入的数据会被刷新到磁盘中保存,另外普通文件也没有被特殊保护,也就是我们可以往里写大量的数据,在写的过程中也有可能被其他进程读,这两个问题是命名管道需要重点处理的,所以命名管道和普通文件有很大的区别,是特殊设计的。这个命名管道,该由谁创建?公共资源:一般要让指定的一个进程现行创建。一个进程创建&&使用,另一个进程获取&&使用。
4、共享内存
共享内存区是最快的IPC形式。一旦这样的内存映射到共享它的进程的地址空间,这些进程间数据传递不再涉及到内核,换句话说是进程不再通过执行进入内核的系统调用来传递彼此的数据。
共享内存 = 共享内存的内核数据结构 + 内存块。让两个进程通过各自的虚拟地址空间,映射同一块物理内存,叫做共享内存。共享内存的本质还是让不同的进程看到同一个资源。
IPC_CEEAT:单独使用,如果shm不存在则创建,如果存在则获取。保证调用进程就能拿到共享内存。IPC_CEEAT | IPC_EXCL:组合使用,如果不存在则创建,如果存在则返回错误。只要成功,一定是新的共享内存。key为什么必须要用户传入,为什么内核自己不生成?
任意进程间是独立的,由某一个进程内生成key,其他的进程是拿不到的。理论上用户可以随意设置key,只要保证不冲突就可,为了保证key的唯一性有函数来减小冲突的概率。
定义全局的key,让进程间通过绝对路径都能看到,由某个进程设置进内核中,则其他进程也能够得到。所以在应用层面,不同进程看到同一份共享内存是通过唯一路径+项目ID来确定的,类似命名管道也是通过文件路径+文件名来确定的。
在OS看来,由shmget函数创建的共享内存是OS创建的,所以共享内存的生命周期随内核。和文件不同,文件的生命周期随进程。所以共享内存一旦创建出来,要么由用户主动释放,要么OS重启。
共享内存的管理指令:
ipcs -m:查看共享内存信息ipcrm -m shmid:删除共享内存shmid VS key:
shmid:仅供用户使用的shm标识符(类似文件描述符fd)key:仅供内核区分不同shm唯一性的标识符(类似文件地址)除了指令删除shm,还可以通过函数删除:
共享内存也有权限。
| 共享内存的特点:
不需要调用系统调用,通信速度快。让两个进程在各自的用户空间共享内存块,是真正的共享资源,但是不像管道,共享内存没有任何保护。共享内存的保护机制,需要用户自己完成。
本篇文章的分享就到这里了,如果您觉得在本文有所收获,还请留下您的三连支持哦~