当前位置: 首页 > news >正文

Nginx 架构浅析

作者:handsomeli,腾讯 IEG 后台开发工程师

1.Nginx 基础架构

Nginx 启动后以 daemon 形式在后台运行,后台进程包含一个 master 进程和多个 worker 进程。如下图所示:

master与worker

Nginx 是由一个 master 管理进程,多个 worker 进程处理工作的多进程模型。基础架构设计,如下图所示:

基础架构设计

master 负责管理 worker 进程,worker 进程负责处理网络事件。整个框架被设计为一种依赖事件驱动、异步、非阻塞的模式。

如此设计的优点:

  • 1.可以充分利用多核机器,增强并发处理能力。

  • 2.多 worker 间可以实现负载均衡。

  • 3.Master 监控并统一管理 worker 行为。在 worker 异常后,可以主动拉起 worker 进程,从而提升了系统的可靠性。并且由 Master 进程控制服务运行中的程序升级、配置项修改等操作,从而增强了整体的动态可扩展与热更的能力。

2.Master 进程


2.1 核心逻辑

master 进程的主逻辑在ngx_master_process_cycle,核心关注源码:

ngx_master_process_cycle(ngx_cycle_t *cycle)
{
    ...
    ngx_start_worker_processes(cycle, ccf->worker_processes,
                                        NGX_PROCESS_RESPAWN);
    ...


    for ( ;; ) {
        if (delay) {...}

        ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, "sigsuspend");

        sigsuspend(&set);

        ngx_time_update();

        ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                             "wake up, sigio %i", sigio);

        if (ngx_reap) {
            ngx_reap = 0;
            ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, "reap children");
            live = ngx_reap_children(cycle);
        }

        if (!live && (ngx_terminate || ngx_quit)) {...}

        if (ngx_terminate) {...}

        if (ngx_quit) {...}

        if (ngx_reconfigure) {...}

        if (ngx_restart) {...}

        if (ngx_reopen) {...}

        if (ngx_change_binary) {...}

        if (ngx_noaccept) {
            ngx_noaccept = 0;
            ngx_noaccepting = 1;
            ngx_signal_worker_processes(cycle,
                                                  ngx_signal_value(NGX_SHUTDOWN_SIGNAL));
        }
    }
 }

由上述代码,可以理解,master 进程主要用来管理 worker 进程,具体包括如下 4 个主要功能:

  • 1.接受来自外界的信号。其中 master 循环中的各项标志位就对应着各种信号,如:ngx_quit代表QUIT信号,表示优雅的关闭整个服务。

  • 2.向各个 worker 进程发送信。比如ngx_noaccept代表WINCH信号,表示所有子进程不再接受处理新的连接,由 master 向所有的子进程发送 QUIT 信号量。

  • 3.监控 worker 进程的运行状态。比如ngx_reap代表CHILD信号,表示有子进程意外结束,这时需要监控所有子进程的运行状态,主要由ngx_reap_children完成。

  • 4.当 woker 进程退出后(异常情况下),会自动重新启动新的 woker 进程。主要也是在ngx_reap_children


2.2 热更


2.2.1 热重载-配置热更
热重载

nginx 热更配置时,可以保持运行中平滑更新配置,具体流程如下:

  • 1.更新 nginx.conf 配置文件,向 master 发送 SIGHUP 信号或执行 nginx -s reload

  • 2.master 进程使用新配置,启动新的 worker 进程

  • 3.使用旧配置的 worker 进程,不再接受新的连接请求,并在完成已存在的连接后退出

2.2.2 热升级-程序热更
热升级

Nginx 热升级过程如下:

  • 1.将旧 Nginx 文件换成新 Nginx 文件(注意备份)

  • 2.向 master 进程发送 USR2 信号(平滑升级到新版本的 Nginx 程序)

  • 3.master 进程修改 pid 文件号,加后缀.oldbin

  • 4.master 进程用新 Nginx 文件启动新 master 进程,此时新老 master/worker 同时存在。

  • 5.向老 master 发送 WINCH 信号,关闭旧 worker 进程,观察新 worker 进程工作情况。若升级成功,则向老 master 进程发送 QUIT 信号,关闭老 master 进程;若升级失败,则需要回滚,向老 master 发送 HUP 信号(重读配置文件),向新 master 发送 QUIT 信号,关闭新 master 及 worker。

3.Worker 进程

3.1 核心逻辑

worker 进程的主逻辑在ngx_worker_process_cycle,核心关注源码:

ngx_worker_process_cycle(ngx_cycle_t *cycle, void *data)
{
    ngx_int_t worker = (intptr_t) data;

    ngx_process = NGX_PROCESS_WORKER;
    ngx_worker = worker;

    ngx_worker_process_init(cycle, worker);

    ngx_setproctitle("worker process");

    for ( ;; ) {

        if (ngx_exiting) {...}

        ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, "worker cycle");

        ngx_process_events_and_timers(cycle);

        if (ngx_terminate) {...}

        if (ngx_quit) {...}

        if (ngx_reopen) {...}
    }
}

由上述代码,可以理解,worker 进程主要在处理网络事件,通过ngx_process_events_and_timers方法实现,其中事件主要包括:网络事件、定时器事件。


3.2 事件驱动-epoll

worker 进程在处理网络事件时,依靠 epoll 模型,来管理并发连接,实现了事件驱动、异步、非阻塞等特性。如下图所示:

infographic-Inside-NGINX_nonblocking

通常海量并发连接过程中,每一时刻(相对较短的一段时间),往往只需要处理一小部分有事件的连接即活跃连接。基于以上现象,epoll 通过将连接管理活跃连接管理进行分离,实现了高效、稳定的网络 IO 处理能力。

网络模型对比

其中,epoll 利用红黑树高效的增删查效率来管理连接,利用一个双向链表来维护活跃连接

epoll数据结构

3.3 惊群

由于 worker 都是由 master 进程 fork 产生,所以 worker 都会监听相同端口。这样多个子进程在 accept 建立连接时会发生争抢,带来著名的“惊群”问题。worker 核心处理逻辑ngx_process_events_and_timers核心代码如下:

void ngx_process_events_and_timers(ngx_cycle_t *cycle){
    //这里面会对监听socket处理
    ...

    if (ngx_accept_disabled > 0) {
            ngx_accept_disabled--;
    } else {
        //获得锁则加入wait集合,
        if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR) {
            return;
        }
        ...
        //设置网络读写事件延迟处理标志,即在释放锁后处理
        if (ngx_accept_mutex_held) {
            flags |= NGX_POST_EVENTS;
        }
    }
    ...
    //这里面epollwait等待网络事件
    //网络连接事件,放入ngx_posted_accept_events队列
    //网络读写事件,放入ngx_posted_events队列
    (void) ngx_process_events(cycle, timer, flags);
    ...
    //先处理网络连接事件,只有获取到锁,这里才会有连接事件
    ngx_event_process_posted(cycle, &ngx_posted_accept_events);
    //释放锁,让其他进程也能够拿到
    if (ngx_accept_mutex_held) {
        ngx_shmtx_unlock(&ngx_accept_mutex);
    }
    //处理网络读写事件
    ngx_event_process_posted(cycle, &ngx_posted_events);
}

由上述代码可知,Nginx 解决惊群的方法:

  • 1.将连接事件与读写事件进行分离。连接事件存放为ngx_posted_accept_events,读写事件存放为ngx_posted_events

  • 2.设置ngx_accept_mutex锁,只有获得锁的进程,才可以处理连接事件。


3.4 负载均衡

worker 间的负载关键在于各自接入了多少连接,其中接入连接抢锁的前置条件是ngx_accept_disabled > 0,所以ngx_accept_disabled就是负载均衡机制实现的关键阈值。

ngx_int_t             ngx_accept_disabled;
ngx_accept_disabled = ngx_cycle->connection_n / 8 - ngx_cycle->free_connection_n;

因此,在 nginx 启动时,ngx_accept_disabled的值就是一个负数,其值为连接总数的 7/8。当该进程的连接数达到总连接数的 7/8 时,该进程就不会再处理新的连接了,同时每次调用'ngx_process_events_and_timers'时,将ngx_accept_disabled减 1,直到其值低于阈值时,才试图重新处理新的连接。因此,nginx 各 worker 子进程间的负载均衡仅在某个 worker 进程处理的连接数达到它最大处理总数的 7/8 时才会触发,其负载均衡并不是在任意条件都满足。如下图所示:

实际工作情况

其中'pid'为 1211 的进程为 master 进程,其余为 worker 进程

4.思考


4.1 为什么不采用多线程模型管理连接?

  • 1.无状态服务,无需共享进程内存

  • 2.采用独立的进程,可以让互相之间不会影响。一个进程异常崩溃,其他进程的服务不会中断,提升了架构的可靠性。

  • 3.进程之间不共享资源,不需要加锁,所以省掉了锁带来的开销。


4.2 为什么不采用多线程处理逻辑业务?

  • 1.进程数已经等于核心数,再新建线程处理任务,只会抢占现有进程,增加切换代价。

  • 2.作为接入层,基本上都是数据转发业务,网络 IO 任务的等待耗时部分,已经被处理为非阻塞/全异步/事件驱动模式,在没有更多 CPU 的情况下,再利用多线程处理,意义不大。并且如果进程中有阻塞的处理逻辑,应该由各个业务进行解决,比如 openResty 中利用了 Lua 协程,对阻塞业务进行了优化。

RECOMMEND

推荐阅读

01

推荐阅读

《Nginx底层设计与源码分析》

本书详解了Nginx架构、执行流程、模块实现与数据结构,剖析了Nginx源码设计精髓与应用。带你深入理解Nginx底层原理与设计,掌握高性能Web服务器开发核心,轻松应对高并发。

不同于市面上常见的Nginx应用书籍,本书从Nginx底层的多进程模型、异步非阻塞I/O、数据结构与内存管理、通信协议与机制等角度分析了Nginx的底层原理和设计思路,揭示了Nginx高并发、高性能的本质。

02

推荐阅读

《Nginx应用与运维实战》

这是一部基于Nginx新版本和云原生应用场景系统讲解Nginx的著作,是作者十余年运维经验的总结。本书从应用、运维以及与Kubernetes和微服务集成3个维度对Nginx的基础知识、工作原理、核心应用、运维管理、集成扩展等重点内容进行了全面、细致的讲解。完全以实战为导向,包含大量的配置案例和示例代码,能帮助读者快速掌握并在实际工作中熟练应用Nginx。

03

推荐阅读

《深入理解Nginx:模块开发与架构解析(第2版)》

书中首先通过介绍官方Nginx的基本用法和配置规则,帮助读者了解一般Nginx模块的用法,然后重点介绍了如何开发HTTP模块(含HTTP过滤模块)来得到定制化的Nginx,其中包括开发一个功能复杂的模块所需要了解的各种知识,并对内存池的实现细节及TCP协议进行了详细介绍;接着,综合Nginx框架代码分析了Nginx架构的设计理念和技巧,此外,还新增了如何在模块中支持HTTP变量,以及与slab共享内存等相关的内容,相信通过完善,可进一步帮助读者更好地开发出功能丰富、性能一流的Nginx模块。


扫码关注【华章计算机】视频号

每天来听华章哥讲书

更多精彩回顾

书讯 | 6月书讯 | 初夏,正好读新书

资讯 | 《数据安全法》表决通过!最新解读来了

书单 | 8本书助你零基础转行数据分析岗

干货 | 阿里云官方出品:全面总结阿里云云原生架构方法论与实践经验

收藏 | 手把手教你利用JS给图片打马赛克

上新 | 【新书速递】深入浅出联邦学习

相关文章:

  • 【第61期】盘点云计算领域不可不读的9本书
  • 【新书速递】重磅!混沌工程权威指南
  • 当机器学习遇上隐私保护,聊聊联邦学习和分布式机器学习
  • 什么是标签?跟数据中台有什么关系?终于有人讲明白了
  • 7月书讯(上)| 读书开启下半年
  • 终于有人把卷积神经网络(CNN)讲明白了
  • 7月书讯(下)| 读书开启下半年
  • 数据中台、标签、数据资产相关的15个名词解释
  • 【新书速递】深入理解Nginx底层原理与设计,轻松应对高并发
  • CSAPP,永远滴神!
  • 周志明:《凤凰架构:构建可靠的大型分布式系统》
  • 【第62期】学会数据分析,抢占职场风口机遇
  • 腾讯数据科学家详解用户选择行为分析核心模型
  • 【新书速递】人人可懂的深度学习
  • 开发人工智能为什么要用Python?
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • canvas 绘制双线技巧
  • Dubbo 整合 Pinpoint 做分布式服务请求跟踪
  • Js基础知识(四) - js运行原理与机制
  • Mithril.js 入门介绍
  • mongodb--安装和初步使用教程
  • Object.assign方法不能实现深复制
  • Storybook 5.0正式发布:有史以来变化最大的版本\n
  • vue2.0开发聊天程序(四) 完整体验一次Vue开发(下)
  • Vue实战(四)登录/注册页的实现
  • 对话:中国为什么有前途/ 写给中国的经济学
  • 仿天猫超市收藏抛物线动画工具库
  • 回顾 Swift 多平台移植进度 #2
  • 机器学习 vs. 深度学习
  • 聚簇索引和非聚簇索引
  • 聊一聊前端的监控
  • 模型微调
  • 前端之React实战:创建跨平台的项目架构
  • 如何进阶一名有竞争力的程序员?
  • 设计模式走一遍---观察者模式
  • 推荐一个React的管理后台框架
  • 一加3T解锁OEM、刷入TWRP、第三方ROM以及ROOT
  • 怎么把视频里的音乐提取出来
  • 完善智慧办公建设,小熊U租获京东数千万元A+轮融资 ...
  • ​configparser --- 配置文件解析器​
  • ​VRRP 虚拟路由冗余协议(华为)
  • #pragma multi_compile #pragma shader_feature
  • #pragma预处理命令
  • #我与Java虚拟机的故事#连载18:JAVA成长之路
  • $refs 、$nextTic、动态组件、name的使用
  • (六)软件测试分工
  • (万字长文)Spring的核心知识尽揽其中
  • (转)visual stdio 书签功能介绍
  • (转载)虚幻引擎3--【UnrealScript教程】章节一:20.location和rotation
  • .Net - 类的介绍
  • .Net Core缓存组件(MemoryCache)源码解析
  • .NET Framework Client Profile - a Subset of the .NET Framework Redistribution
  • .NET 应用架构指导 V2 学习笔记(一) 软件架构的关键原则
  • .NET/C# 如何获取当前进程的 CPU 和内存占用?如何获取全局 CPU 和内存占用?
  • .Net6支持的操作系统版本(.net8已来,你还在用.netframework4.5吗)