【Nginx】第七章 Nginx原理与优化参数配置

7.1 Nginx原理

master-workers的机制的好处

首先，对于每个worker进程来说，独立的进程，不需要加锁，所以省掉了锁带来的开销，同时在编程以及问题查找时，也会方便很多。

其次，采用独立的进程，可以让互相之间不会影响，一个进程退出后，其它进程还在工作，服务不会中断，master进程则很快启动新的worker进程。

当然，worker进程的异常退出，肯定是程序有bug了，异常退出，会导致当前worker上的所有请求失败，不过不会影响到所有请求，所以降低了风险。

需要设置多少个worker

Nginx 同redis类似都采用了io多路复用机制，每个worker都是一个独立的进程，但每个进程里只有一个主线程，通过异步非阻塞的方式来处理请求，即使是千上万个请求也不在话下。每个worker的线程可以把一个cpu的性能发挥到极致。

所以worker数和服务器的cpu数相等是最为适宜的。设少了会浪费cpu，设多了会造成cpu频繁切换上下文带来的损耗。

#设置worker数量

worker_processes 4

#work绑定cpu(4 work绑定4cpu)。

worker_cpu_affinity 0001 0010 0100 1000

#work绑定cpu (4 work绑定8cpu中的4个) 。

worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000

#连接数

worker_connections 1024

这个值是表示每个worker进程所能建立连接的最大值，所以，一个nginx能建立的最大连接数，应该是worker_connections * worker_processes。当然，这里说的是最大连接数，对于HTTP请求本地资源来说，能够支持的最大并发数量是worker_connections * worker_processes，如果是支持http1.1的浏览器每次访问要占两个连接，所以普通的静态访问最大并发数是： worker_connections * worker_processes /2，而如果是HTTP作为反向代理来说，最大并发数量应该是worker_connections * worker_processes/4。

因为作为反向代理服务器，每个并发会建立与客户端的连接和与后端服务的连接，会占用两个连接。

面试题：

第一个：发送请求，占用了woker的几个连接数？

第二个：nginx有一个master，有四个woker，每个woker支持最大的连接数1024，支持的最大并发数是多少？

7.2 Nginx.conf配置详解

#安全问题，建议用nobody,不要用root.

#user nobody;

#worker数和服务器的cpu数相等是最为适宜

worker_processes 2;

#work绑定cpu(4 work绑定4cpu)

worker_cpu_affinity 0001 0010 0100 1000

#work绑定cpu (4 work绑定8cpu中的4个) 。

worker_cpu_affinity 0000001 00000010 00000100 00001000

#error_log path(存放路径) level(日志等级) path表示日志路径，level表示日志等级，

#从左至右，日志详细程度逐级递减，即debug最详细，crit最少，默认为crit。

#error_log logs/error.log;

#error_log logs/error.log notice;

#error_log logs/error.log info;

#pid logs/nginx.pid;

events {

#这个值是表示每个worker进程所能建立连接的最大值，所以，一个nginx能建立的最大连接数，应该是worker_connections * worker_processes。

#当然，这里说的是最大连接数，对于HTTP请求本地资源来说，能够支持的最大并发数量是worker_connections * worker_processes，

#如果是支持http1.1的浏览器每次访问要占两个连接，

#所以普通的静态访问最大并发数是： worker_connections * worker_processes /2，

#而如果是HTTP作为反向代理来说，最大并发数量应该是worker_connections * worker_processes/4。

#因为作为反向代理服务器，每个并发会建立与客户端的连接和与后端服务的连接，会占用两个连接。

worker_connections 1024;

#这个值是表示nginx要支持哪种多路io复用。

#一般的Linux选择epoll, 如果是(*BSD)系列的Linux使用kquene。

#windows版本的nginx不支持多路IO复用，这个值不用配。

use epoll;

# 当一个worker抢占到一个链接时，是否尽可能的让其获得更多的连接,默认是off 。

multi_accept on; //并发量大时缓解客户端等待时间。

# 默认是on ,开启nginx的抢占锁机制。

accept_mutex off; //master指派worker抢占锁

}

http {

#当web服务器收到静态的资源文件请求时，依据请求文件的后缀名在服务器的MIME配置文件中找到对应的MIME Type，再根据MIME Type设置HTTP Response的Content-Type，然后浏览器根据Content-Type的值处理文件。

include mime.types; #/usr/local/nginx/conf/mime.types

#如果不能从mime.types找到映射的话，用以下作为默认值-二进制

default_type application/octet-stream;

#日志位置

access_log logs/host.access.log main;

#一条典型的accesslog：

#101.226.166.254 - - [21/Oct/2013:20:34:28 +0800] "GET /movie_cat.php?year=2013 HTTP/1.1" 200 5209 "http://www.baidu.com" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; MDDR; .NET4.0C; .NET4.0E; .NET CLR 1.1.4322; Tablet PC 2.0); 360Spider"

#1）101.226.166.254:(用户IP)

#2）[21/Oct/2013:20:34:28 +0800]：(访问时间)

#3）GET：http请求方式，有GET和POST两种

#4）/movie_cat.php?year=2013：当前访问的网页是动态网页，movie_cat.php即请求的后台接口，year=2013为具体接口的参数

#5）200：服务状态，200表示正常，常见的还有，301永久重定向、4XX表示请求出错、5XX服务器内部错误

#6）5209：传送字节数为5209，单位为byte

#7）"http://www.baidu.com"：refer:即当前页面的上一个网页

#8）"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; #.NET CLR 3.0.30729; Media Center PC 6.0; MDDR; .NET4.0C; .NET4.0E; .NET CLR 1.1.4322; Tablet PC 2.0); 360Spider"： agent字段：通常用来记录操作系统、浏览器版本、浏览器内核等信息

log_format main '$remote_addr - $remote_user [$time_local] "$request" '

'$status $body_bytes_sent "$http_referer" '

'"$http_user_agent" "$http_x_forwarded_for"';

#开启从磁盘直接到网络的文件传输，适用于有大文件上传下载的情况，提高IO效率。

sendfile on; //大文件传递优化，提高效率

#一个请求完成之后还要保持连接多久, 默认为0，表示完成请求后直接关闭连接。

#keepalive_timeout 0;

keepalive_timeout 65;

#开启或者关闭gzip模块

#gzip on ; //文件压缩，再传输，提高效率

#设置允许压缩的页面最小字节数，页面字节数从header头中的Content-Length中进行获取。

#gzip_min_lenth 1k;//超过该大小开始压缩，否则不用压缩

# gzip压缩比，1 压缩比最小处理速度最快，9 压缩比最大但处理最慢（传输快但比较消耗cpu）

#gzip_comp_level 4;

#匹配MIME类型进行压缩，（无论是否指定）"text/html"类型总是会被压缩的。

#gzip_types types text/plain text/css application/json application/x-javascript text/xml

#动静分离

#服务器端静态资源缓存，最大缓存到内存中的文件，不活跃期限

open_file_cache max=655350 inactive=20s;

#活跃期限内最少使用的次数，否则视为不活跃。

open_file_cache_min_uses 2;

#验证缓存是否活跃的时间间隔

open_file_cache_valid 30s;

upstream myserver{

# 1、轮询（默认）

# 每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。

# 2、指定权重

# 指定轮询几率，weight和访问比率成正比，用于后端服务器性能不均的情况。

#3、IP绑定 ip_hash

# 每个请求按访问ip的hash结果分配，这样每个访客固定访问一个后端服务器，可以解决session的问题。

#4、备机方式 backup

# 正常情况不访问设定为backup的备机，只有当所有非备机全都宕机的情况下，服务才会进备机。当非备机启动后，自动切换到非备机

# ip_hash;

server 192.168.161.132:8080 weight=1;

server 192.168.161.132:8081 weight=1 backup;

#5、fair（第三方）公平，需要安装插件才能用

#按后端服务器的响应时间来分配请求，响应时间短的优先分配。

#6、url_hash（第三方）

#按访问url的hash结果来分配请求，使每个url定向到同一个后端服务器，后端服务器为缓存时比较有效。

# ip_hash;

server 192.168.161.132:8080 weight=1;

server 192.168.161.132:8081 weight=1;

#fair

#hash $request_uri

#hash_method crc32

}

server {

#监听端口号

listen 80;

#服务名

server_name 192.168.161.130;

#字符集

#charset utf-8;

#location [=|~|~*|^~] /uri/ { … }

# = 精确匹配

# ~ 正则匹配，区分大小写

# ~* 正则匹配，不区分大小写

# ^~ 关闭正则匹配

#匹配原则：

# 1、所有匹配分两个阶段，第一个叫普通匹配，第二个叫正则匹配。

# 2、普通匹配，首先通过“=”来匹配完全精确的location

# 2.1、如果没有精确匹配到，那么按照最大前缀匹配的原则，来匹配location

# 2.2、如果匹配到的location有^~,则以此location为匹配最终结果，如果没有那么会把匹配的结果暂存，继续进行正则匹配。

# 3、正则匹配，依次从上到下匹配前缀是~或~*的location, 一旦匹配成功一次，则立刻以此location为准，不再向下继续进行正则匹配。

# 4、如果正则匹配都不成功，则继续使用之前暂存的普通匹配成功的location.

#不是以波浪线开头的都是普通匹配。

location / { # 匹配任何查询，因为所有请求都以 / 开头。但是正则表达式规则和长的块规则将被优先和查询匹配。

#定义服务器的默认网站根目录位置

root html;//相对路径，省略了./ /user/local/nginx/html 路径

#默认访问首页索引文件的名称

index index.html index.htm;

#反向代理路径

proxy_pass http://myserver;

#反向代理的超时时间

proxy_connect_timeout 10;

proxy_redirect default;

}

#普通匹配

location /images/ {

root images ;

}

# 反正则匹配

location ^~ /images/jpg/ { # 匹配任何以 /images/jpg/ 开头的任何查询并且停止搜索。任何正则表达式将不会被测试。

root images/jpg/ ;

}

#正则匹配

location ~*.(gif|jpg|jpeg)$ {

#所有静态文件直接读取硬盘

root pic ;

#expires定义用户浏览器缓存的时间为3天，如果静态页面不常更新，可以设置更长，这样可以节省带宽和缓解服务器的压力

expires 3d; #缓存3天

}

#error_page 404 /404.html;

# redirect server error pages to the static page /50x.html

error_page 500 502 503 504 /50x.html;

location = /50x.html {

root html;

}