当前位置: 首页 > news >正文

Linux从0到1——进程池

Linux从0到1——进程池

  • 1. 进程池的概念
  • 2. 进程池实现思路
  • 3. 进程池的代码实现
    • 3.1 创建管道,创建子进程
    • 3.2 封装任务
    • 3.3 Work接口
    • 3.4 发送任务
    • 3.5 回收资源,关闭管道(重点)
    • 3.6 改造CreatChannels接口
  • 4. 完整代码


1. 进程池的概念


1. 池化技术:

  • 在古代,有一种建筑叫粮仓,用来储存粮食。人们一般会先把大量的粮食囤积在粮仓中,等到需要用粮食时,再从粮仓中一点一点的拿。相当于是先把粮食提前准备好,你需要的时候直接去拿就行了,不然的话每次用粮食前还要先去田里收割粮食。

2. 内存池:

  • 计算机中有很多的设计理念,都用到了池化技术。如内存池,当一个进程需要申请空间时,OS会一次性开辟好大量的空间,进程直接去使用这些空间即可。而不是每一次进程申请空间时,操作系统都要做开辟空间的动作,这样太低效了。

3. 进程池:

  • 如果我们每启动一个任务,就创建一个进程来完成这个任务,这样未免有些低效。我们可以将多个进程一次性开辟好,等任务来的时候,直接丢给开辟好的进程即可,省去了多次创建进程的时间开销。

2. 进程池实现思路


在这里插入图片描述

  • 一次性开辟多个管道和多个子进程,让每一个管道和子进程一一对应。

  • 父进程每次向管道中送入4字节int类型的数据,表示需要执行任务的任务码code,一旦管道中被放入了数据,意味着这个管道对应的子进程被激活,开始执行任务码对应的任务。


3. 进程池的代码实现


3.1 创建管道,创建子进程


1. 描述管道:

  • 为了管理我们创建的管道,需要为其创建对应的结构体来描述它,然后用一定的数据结构组织起来。
const int num = 5; // 最大管道数
int number = 0;    // 管道编号class channel
{
public:channel(int fd, pid_t id): ctrlfd(fd), workerid(id){name = "channel-" + std::to_string(++number);}public:int ctrlfd;         // 管道写端pid_t workerid;     // 对应的子进程pidstd::string name;   // 管道名
};
  • 结构体中,需要记录管道的写端,以便将来父进程关闭。
  • 还需要记录对应的子进程pid,以便子进程退出后,wait处理子进程僵尸状态。

2. 创建管道,创建进程:

  • 介绍一下C++中规范的传参形式:
    • 输入型参数:const &
    • 输出型参数:*
    • 输入输出型参数:&
// 传参形式:
// 1. 输入参数:const &
// 2. 输出参数:*
// 3. 输入输出参数:&void CreatChannels(std::vector<channel> *c)
{// bug versionfor (int i = 0; i < num; i++){// 1. 定义并创建管道int pipefd[2];int n = pipe(pipefd);assert(n == 0);(void)n;// 2. 创建进程pid_t id = fork();assert(id != -1);// 3. 构建单向通信信道if (id == 0){// childclose(pipefd[1]); // 关闭写端// TODOdup2(pipefd[0], 0); // 重定向Work();exit(0);    // 会自动关闭自己打开的所有fd}// fatherclose(pipefd[0]); // 关闭读端c->push_back(channel(pipefd[1], id));}
}int main()
{std::vector<channel> channels;// 创建信道,创建进程CreatChannels(&channels);// ...return 0;
}
  • Work函数为将来子进程执行任务时要完成的模块。重定向操作执行后,每一个子进程中,fd为0的位置就指向读端。
  • 每建立一条管道,就将它放入数组中。这样,对管道的管理就变为了对数组的管理。

上面这种创建管道和进程的方式有一个很深层次的bug,我们到后面说。


3.2 封装任务


Task.hpp头文件:

#pragma once#include <iostream>
#include <functional>
#include <vector>
#include <ctime>
#include <unistd.h>typedef std::function<void()> task_t;// 三个任务
void Download()
{std::cout << "我是一个下载任务" << " 处理者: " << getpid() << std::endl;
}void PrintLog()
{std::cout << "我是一个打印日志的任务" << " 处理者: " << getpid() << std::endl;
}void PushVideoStream()
{std::cout << "我是一个推送视频流的任务" << " 处理者: " << getpid() << std::endl;
}class Init
{
public:// 任务码const static int g_download_code = 0;const static int g_printlog_code = 1;const static int g_push_videostream_code = 2;// 任务集合std::vector<task_t> tasks;
public:Init(){tasks.push_back(Download);tasks.push_back(PrintLog);tasks.push_back(PushVideoStream);srand(time(nullptr) ^ getpid());    // ^getpid(),让数据更有随机性}// 检查任务码是否安全bool CheckSafe(int code){if (code >= 0 && code < tasks.size()) return true;else return false;}// 执行任务void RunTask(int code){tasks[code]();}// 选择任务int SelectTask(){// 返回随机任务码return rand() % tasks.size();}// 返回任务码对应的任务std::string ToDesc(const int &code){switch(code){case g_download_code:return "Download";case g_printlog_code:return "PrintLog";case g_push_videostream_code:return "PushVideoStream";default:return "Unknow";}return "";}
};Init init;  // 定义对象
  • 定义了三条任务,即这三条任务对应的任务码。
  • 定义了一个Init类来封装这些任务,以及提供对应的接口。
  • 这里我们采取随机选择任务的设计,实际应用中会有所不同。三个任务也只是象征性的模拟一下,并不是具体的下载,打印日志,推送视频流任务。

3.3 Work接口


不断从管道中读取任务码,执行对应的任务。直到写端关闭。

void Work()
{while (true){int code = 0;   // 任务码ssize_t n = read(0, &code, sizeof(code));if (n == sizeof(code)){if (!init.CheckSafe(code))continue;init.RunTask(code);}else if (n == 0){// n == 0 写端退出break;}else{// do nothing}}std::cout << "child quit" << std::endl;
}

3.4 发送任务


  • 设计了标签g_always_loop来控制是否一直发送任务。true为一直发送,false为不是一直发送。传false要配合参数num,标明发送次数。
  • 轮巡式的向管道中发送信息。
const bool g_always_loop = true;    // 是否一直执行void SendCommand(const std::vector<channel> &channels, bool flag, int num = -1)
{int pos = 0;while (true){// 1. 选择任务int command = init.SelectTask();// 2. 选择信道(进程)const auto &c = channels[pos++];pos %= channels.size();// debugstd::cout << "send command " << init.ToDesc(command) << "[" << command << "]" << " in" << c.name << "worker is: " << c.workerid << std::endl;// 3. 发送任务write(c.ctrlfd, &command, sizeof(command));// 4. 判断是否要退出if (!flag){num--;if (num <= 0) break;}sleep(1);}std::cout << "SendCommand done..." << std::endl;
}int main()
{std::vector<channel> channels;// 创建信道,创建进程CreatChannels(&channels);// 开始发送任务SendCommand(channels, !g_always_loop, 10);// ...return 0;
}

3.5 回收资源,关闭管道(重点)


1. 版本1:

  • 这种版本为,先将写端全部关闭,再回收子进程,自动关闭读端,循环两次。该版本不会出bug
  • 原理是,写端关闭后,Work模块中read会读到0,子进程就会执行到exit退出。
void ReleaseChannels(const std::vector<channel> &channels)
{// version1for (const auto &c : channels){close(c.ctrlfd);}for (const auto &c : channels){pid_t rid = waitpid(c.workerid, nullptr, 0);if (rid == c.workerid){std::cout << "wait child: " << c.workerid << " success" << std::endl;}}
}int main()
{std::vector<channel> channels;// 创建信道,创建进程CreatChannels(&channels);// 开始发送任务SendCommand(channels, !g_always_loop, 10);// 回收资源,想让子进程退出,并且释放管道资源,只要关闭写端即可(写端关闭后,子进程自动退出)ReleaseChannels(channels);return 0;
}

2. 会出现bug的版本:

  • 关闭一个写端,就关闭对应的读端,循环一次。
  • 这种版本会出现bug,现象就是会在发送任务完成时卡死。
void ReleaseChannels(const std::vector<channel> &channels)
{// bug versionfor (const auto &c : channels){close(c.ctrlfd);pid_t rid = waitpid(c.workerid, nullptr, 0);if (rid == c.workerid){std::cout << "wait child: " << c.workerid << " success" << std::endl;}}
}

在这里插入图片描述

3. 分析bug出现的原因:

在这里插入图片描述

  • 这个bug要追溯到创建管道的模块。首先,如果以我们之前的方式创建管道和进程,那么在创建第二个管道时,子进程拷贝父进程struct files_struct结构体,将上一个管道的写端也拷贝下来了。此时,第一个管道就会有两个写端。
  • 以此类推,在创建第三个管道时,子进程又将父进程的struct files_struct结构体继承下来了。第一个管道就会有三个写端,第二个管道会有两个写端。
  • 此时如果从第一个管道开始关闭管道,回收子进程,就会出现,第一个管道只关闭了一个写端,read无法读取到0,子进程在read处阻塞的情况。
  • 版本1之所以不会出现bug,是因为,最后一个管道只有一个写端,将父进程对应的写端一次性全部关闭后,最后一个进程就没有写端了,最后一个子进程就会退出。最后一个子进程退出了,倒数第二个管道也就没有写端了,倒数第二个子进程也要跟着退出。从后向前,管道和子进程资源依次释放。

2. 版本2:

  • 根据上面分析的bug出现原因,我们只需要从后向前关闭管道即可。
void ReleaseChannels(const std::vector<channel> &channels)
{// version2int num = channels.size() - 1;for (; num >= 0; num--){close(channels[num].ctrlfd);pid_t rid = waitpid(channels[num].workerid, nullptr, 0);if (rid == channels[num].workerid){std::cout << "wait child: " << channels[num].workerid << " success" << std::endl;}}
}

在这里插入图片描述


3.6 改造CreatChannels接口


通过3.5的讲解,我们是可以从后向前关闭管道,来解决卡死的问题。但是,这毕竟不是问题的本质,我们期望的管道是单向通信的,也就是只有一个写端和一个读端,出现一个管道多个写端的情况,不是我们想看到的。

所以,我们可以在创建管道时,提前记录一下子进程都从父进程继承下来了哪些写端,然后让子进程将这些写端关闭。

void CreatChannels(std::vector<channel> *c)
{std::vector<int> old;for (int i = 0; i < num; i++){// 1. 定义并创建管道int pipefd[2];int n = pipe(pipefd);assert(n == 0);(void)n;// 2. 创建进程pid_t id = fork();assert(id != -1);// 3. 构建单向通信信道if (id == 0){// child// 关闭从父进程继承下来的写端if (!old.empty()){for (auto fd : old){close(fd);}// debugPrintFd(old);}close(pipefd[1]); // 关闭写端// TODOdup2(pipefd[0], 0); // 重定向Work();exit(0);    // 会自动关闭自己打开的所有fd}// fatherclose(pipefd[0]); // 关闭读端c->push_back(channel(pipefd[1], id));old.push_back(pipefd[1]);}
}
  • 这样一来,问题就解决了,回收资源时使用3.5中的bug版本也没有问题。可以说,那个bug版本才是逻辑最恰当的版本。

4. 完整代码


1. Task.hpp头文件:

#pragma once#include <iostream>
#include <functional>
#include <vector>
#include <ctime>
#include <unistd.h>typedef std::function<void()> task_t;void Download()
{std::cout << "我是一个下载任务" << " 处理者: " << getpid() << std::endl;
}void PrintLog()
{std::cout << "我是一个打印日志的任务" << " 处理者: " << getpid() << std::endl;
}void PushVideoStream()
{std::cout << "我是一个推送视频流的任务" << " 处理者: " << getpid() << std::endl;
}class Init
{
public:// 任务码const static int g_download_code = 0;const static int g_printlog_code = 1;const static int g_push_videostream_code = 2;// 任务集合std::vector<task_t> tasks;
public:Init(){tasks.push_back(Download);tasks.push_back(PrintLog);tasks.push_back(PushVideoStream);srand(time(nullptr) ^ getpid());    // ^getpid(),让数据更有随机性}// 检查任务码是否安全bool CheckSafe(int code){if (code >= 0 && code < tasks.size()) return true;else return false;}// 执行任务void RunTask(int code){tasks[code]();}int SelectTask(){// 返回随机任务码return rand() % tasks.size();}// 返回任务码对应的具体任务std::string ToDesc(const int &code){switch(code){case g_download_code:return "Download";case g_printlog_code:return "PrintLog";case g_push_videostream_code:return "PushVideoStream";default:return "Unknow";}return "";}
};Init init;  // 定义对象

2. ProcessPool.cc文件:

#include <iostream>
#include <string>
#include <vector>
#include <cassert>
#include <unistd.h>
#include <sys/wait.h>
#include <sys/types.h>
#include "Task.hpp"const int num = 5; // 最大管道数
int number = 0;    // 管道编号class channel
{
public:channel(int fd, pid_t id): ctrlfd(fd), workerid(id){name = "channel-" + std::to_string(++number);}public:int ctrlfd;         // 管道写端pid_t workerid;     // 对应的子进程pidstd::string name;   // 管道名
};void Work()
{while (true){int code = 0;   // 任务码ssize_t n = read(0, &code, sizeof(code));if (n == sizeof(code)){if (!init.CheckSafe(code))continue;init.RunTask(code);}else if (n == 0){// n == 0 写端退出break;}else{// do nothing}}std::cout << "child quit" << std::endl;
}// 打印都关闭了哪些从父进程继承下来的写端
void PrintFd(const std::vector<int> &fds)
{std::cout << getpid() << " close: ";for (auto fd : fds){std::cout << fd << " ";}std::cout << std::endl;
}// 传参形式:
// 1. 输入参数:const &
// 2. 输出参数:*
// 3. 输入输出参数:&void CreatChannels(std::vector<channel> *c)
{std::vector<int> old;for (int i = 0; i < num; i++){// 1. 定义并创建管道int pipefd[2];int n = pipe(pipefd);assert(n == 0);(void)n;// 2. 创建进程pid_t id = fork();assert(id != -1);// 3. 构建单向通信信道if (id == 0){// child// 关闭从父进程继承下来的写端if (!old.empty()){for (auto fd : old){close(fd);}// debugPrintFd(old);}close(pipefd[1]); // 关闭写端// TODOdup2(pipefd[0], 0); // 重定向Work();exit(0);    // 会自动关闭自己打开的所有fd}// fatherclose(pipefd[0]); // 关闭读端c->push_back(channel(pipefd[1], id));old.push_back(pipefd[1]);}// bug version// for (int i = 0; i < num; i++)// {//     // 1. 定义并创建管道//     int pipefd[2];//     int n = pipe(pipefd);//     assert(n == 0);//     (void)n;//     // 2. 创建进程//     pid_t id = fork();//     assert(id != -1);//     // 3. 构建单向通信信道//     if (id == 0)//     {//         // child//         close(pipefd[1]); // 关闭写端//         // TODO//         dup2(pipefd[0], 0); // 重定向//         Work();//         exit(0);    // 会自动关闭自己打开的所有fd//     }//     // father//     close(pipefd[0]); // 关闭读端//     c->push_back(channel(pipefd[1], id));// }
}void PrintfDebug(const std::vector<channel> &c)
{for (const auto &channel : c){std::cout << channel.name << ", " << channel.ctrlfd << ", " << channel.workerid << std::endl;}
}const bool g_always_loop = true;    // 是否一直执行void SendCommand(const std::vector<channel> &channels, bool flag, int num = -1)
{int pos = 0;while (true){// 1. 选择任务int command = init.SelectTask();// 2. 选择信道(进程)const auto &c = channels[pos++];pos %= channels.size();// debugstd::cout << "send command " << init.ToDesc(command) << "[" << command << "]" << " in" << c.name << "worker is: " << c.workerid << std::endl;// 3. 发送任务write(c.ctrlfd, &command, sizeof(command));// 4. 判断是否要退出if (!flag){num--;if (num <= 0) break;}sleep(1);}std::cout << "SendCommand done..." << std::endl;
}void ReleaseChannels(const std::vector<channel> &channels)
{// version2// int num = channels.size() - 1;// for (; num >= 0; num--)// {//     close(channels[num].ctrlfd);//     pid_t rid = waitpid(channels[num].workerid, nullptr, 0);//     if (rid == channels[num].workerid)//     {//         std::cout << "wait child: " << channels[num].workerid << " success" << std::endl;//     }// }// version1// for (const auto &c : channels)// {//     close(c.ctrlfd);// }// for (const auto &c : channels)// {//     pid_t rid = waitpid(c.workerid, nullptr, 0);//     if (rid == c.workerid)//     {//         std::cout << "wait child: " << c.workerid << " success" << std::endl;//     }// }// bug versionfor (const auto &c : channels){close(c.ctrlfd);pid_t rid = waitpid(c.workerid, nullptr, 0);if (rid == c.workerid){std::cout << "wait child: " << c.workerid << " success" << std::endl;}}
}int main()
{std::vector<channel> channels;// 创建信道,创建进程CreatChannels(&channels);// 开始发送任务SendCommand(channels, !g_always_loop, 10);// PrintfDebug(channels);// sleep(10);// 回收资源,想让子进程退出,并且释放管道资源,只要关闭写端即可(写端关闭后,子进程自动退出)ReleaseChannels(channels);return 0;
}

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 江协科技STM32学习笔记
  • HBase snapshot+replication 测试
  • 不依靠for循环,Python如何对列表进行去重并保留排列顺序
  • <Qt> 系统 - 事件
  • 计算机网络——HTTP协议详解(上)
  • 7万字详解Apache Shiro面试题、示例、参考答案
  • 文心快码 Baidu Comate 前端工程师观点分享:行业现状(二)
  • 贷齐乐系统最新版SQL注入(绕过WAF可union select跨表查询)
  • 字符串函数!!!(续)(C语言)
  • Git 大文件存储 (LFS)
  • uniapp跳转携带参数
  • zigbee笔记:十、ZStack(2.3.0-1.4.0)的OSAL使用分析
  • Spark SQL Catalyst工作流程
  • 如何高效记录并整理编程学习笔记?
  • 【论文阅读】Far3D: Expanding the Horizon for Surround-view 3D Object Detection
  • Babel配置的不完全指南
  • laravel5.5 视图共享数据
  • Linux中的硬链接与软链接
  • overflow: hidden IE7无效
  • Rancher如何对接Ceph-RBD块存储
  • rc-form之最单纯情况
  • RxJS 实现摩斯密码(Morse) 【内附脑图】
  • SOFAMosn配置模型
  • Travix是如何部署应用程序到Kubernetes上的
  • Vultr 教程目录
  • windows-nginx-https-本地配置
  • zookeeper系列(七)实战分布式命名服务
  • 彻底搞懂浏览器Event-loop
  • 构建工具 - 收藏集 - 掘金
  • 诡异!React stopPropagation失灵
  • 互联网大裁员:Java程序员失工作,焉知不能进ali?
  • 扑朔迷离的属性和特性【彻底弄清】
  • 实现菜单下拉伸展折叠效果demo
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • Nginx惊现漏洞 百万网站面临“拖库”风险
  • Unity3D - 异步加载游戏场景与异步加载游戏资源进度条 ...
  • 哈罗单车融资几十亿元,蚂蚁金服与春华资本加持 ...
  • # Java NIO(一)FileChannel
  • #1014 : Trie树
  • #Lua:Lua调用C++生成的DLL库
  • #nginx配置案例
  • #Z2294. 打印树的直径
  • #宝哥教你#查看jquery绑定的事件函数
  • (3)nginx 配置(nginx.conf)
  • (javaweb)Http协议
  • (WSI分类)WSI分类文献小综述 2024
  • (阿里巴巴 dubbo,有数据库,可执行 )dubbo zookeeper spring demo
  • (笔记)M1使用hombrew安装qemu
  • (纯JS)图片裁剪
  • (第30天)二叉树阶段总结
  • (函数)颠倒字符串顺序(C语言)
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (算法)求1到1亿间的质数或素数
  • (自用)仿写程序
  • .gitignore文件_Git:.gitignore