Nginx 原理
Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。
Nginx进程模型
Nginx 是一个多进程的模型,主要分为一个 Master 进程、多个 Worker 进程。
Master 进程: 管理 Worker 进程。
- 对外接口:接收外部的操作(信号);
- 对内转发:根据外部的操作的不同,通过信号管理 Worker;
- 监控:监控 Worker 进程的运行状态,Worker 进程异常终止后,自动重启 Worker 进程。
Worker 进程: 所有 Worker 进程都是平等的。
- 实际处理:网络请求,由 Worker 进程处理。
- Worker 进程数量:在 nginx.conf 中配置,一般设置为核心数,充分利用 CPU 资源,同时,避免进程数量过多,避免进程竞争 CPU 资源,增加上下文切换的损耗。
HTTP 连接建立和请求处理过程
- Nginx 启动时,Master 进程,加载配置文件。
- Master 进程,初始化监听的 Socket。
- Master 进程,Fork 出多个 Worker 进程。
- Worker 进程,竞争新的连接,获胜方通过三次握手,建立 Socket 连接,并处理请求。
Nginx 高性能、高并发
Nginx 为什么拥有高性能并且能够支撑高并发?
- Nginx 采用多进程 + 异步非阻塞方式(IO 多路复用 Epoll)。
- 请求的完整过程:建立连接→读取请求→解析请求→处理请求→响应请求。
- 请求的完整过程对应到底层就是:读写 Socket 事件。
Nginx 的事件处理模型
Request:Nginx 中 HTTP 请求。
基本的 HTTP Web Server 工作模式:
- 接收请求: 逐行读取请求行和请求头,判断段有请求体后,读取请求体。
- 处理请求。
- 返回响应: 根据处理结果,生成相应的 HTTP 请求(响应行、响应头、响应体)。
模块化体系结构
nginx的模块根据其功能基本上可以分为以下几种类型:
- event module:搭建了独立于操作系统的事件处理机制的框架,及提供了各具体事件的处理。包括ngx_events_module,ngx_event_core_module和ngx_epoll_module等。nginx具体使用何种事件处理模块,这依赖于具体的操作系统和编译选项。
- phase handler:此类型的模块也被直接称为handler模块。主要负责处理客户端请求并产生待响应内容,比如ngx_http_static_module模块,负责客户端的静态页面请求处理并将对应的磁盘文件准备为响应内容输出。
- output filter:也称为filter模块,主要是负责对输出的内容进行处理,可以对输出进行修改。例如,可以实现对输出的所有html页面增加预定义的footbar一类的工作,或者对输出的图片的URL进行替换之类的工作。
- upstream:upstream模块实现反向代理的功能,将真正的请求转发到后端服务器上,并从后端服务器上读取响应,发回客户端。upstream模块是一种特殊的handler,只不过响应内容不是真正由自己产生的,而是从后端服务器上读取的。
- load-balancer:负载均衡模块,实现特定的算法,在众多的后端服务器中,选择一个服务器出来作为某个请求的转发服务器。
Nginx 最大连接数
基础背景:
- Nginx 是多进程模型,Worker 进程用于处理请求;
- 单个进程的连接数(文件描述符 fd),有上限(nofile):ulimit -n
- Nginx 上配置单个 worker 进程的最大连接数:worker_connections 上限为 nofile
- Nginx 上配置 worker 进程的数量:worker_processes
因此,Nginx 的最大连接数:
- Nginx 的最大连接数:Worker 进程数量 x 单个 Worker 进程的最大连接数
- 上面是 Nginx 作为通用服务器时,最大的连接数
- Nginx 作为反向代理服务器时,能够服务的最大连接数:(Worker 进程数量 x 单个 Worker 进程的最大连接数)/ 2。
- Nginx 反向代理时,会建立 Client 的连接和后端 Web Server 的连接,占用 2 个连接
Nginx 的工作方式
Nginx 并不会为每一个的 web 请求创建新的进程,相反,管理员可以配置 Nginx 主进程的工作进程的数量(一个常见的做法是为每一个 CPU 配置一个工作进程)。所有这些进程都是单线程的。每一个工作进程可以处理数千个并发的请求。它通过一个线程来异步的完成了这些工作,而没有使用多线程的编程模型。
Nginx 还拆分了缓存加载器(cache loader)和缓存管理器(cache manager)进程用来从磁盘中读取数据并将其加载到缓存中,当缓存直接读取的时候缓存过期。
Nginx 有一系列的模块组成,这些模块在编译的时候就被包含进去了。这意味着,用户下载源码并选择他们要编译的模块。这些模块中包括连接后端应用服务器,负载均衡,代理服务器以及其他。并没有 PHP 的模块,因为 Nginx可 以自己编译 PHP 代码。
下图为 Nginx 的架构
从这个图表中我们可以看出,Nginx 使用 FastCGI 进程来执行 Python,Ruby 以及其他代码,使用 Memcached 对象缓存系统。工作进程为 HTTP 请求加载 ht_core Nginx 进程。我们还可以看到,Nginx 和 Windows 以及 Linux 内核的功能紧密的集成在了一起,以便提升性能。这些内核功能已经经过长时间的改良,而 Nginx 正是利用了这一点。
Nginx 声称是事件驱动,异步且无阻塞的。“事件(Event)”指的是一个用户的连接。“异步(Asynchronous)”指的是它一次处理多个用户连接的用户交互。“无阻塞(Non-blocking)”指的是它不会由于 CPU 处于忙状态而停止磁盘的 I/O,在这种情况下,它会处理其他事件,直到 I/O 资源得到释放。
网络 IO 模型:
nginx:IO 多路复用,epoll(freebsd 上是 kqueue )
- 高性能
- 高并发
- 占用系统资源少
apache:阻塞 + 多进程/多线程
- 更稳定,bug 少
- 模块更丰富
IO 多路复用:单个连接的请求处理速度没有优势,适合 IO 密集型 场景,事件驱动
- 大并发量:只使用一个线程,处理大量的并发请求,降低上下文环境切换损耗,也不需要考虑并发问题,相对可以处理更多的请求;
- 消耗更少的系统资源(不需要线程调度开销)
- 适用于长连接的情况(多线程模式长连接容易造成线程过多,造成频繁调度)
阻塞IO + 多线程:实现简单,可以不依赖系统调用,适合 CPU 密集型 场景
- 每个线程,都需要时间和空间;
- 线程数量增长时,线程调度开销指数增长
转载自:https://www.cnblogs.com/zhuminghui/p/13792557.html