15、Nginx---slice模块,大文件分片请求

news2025/3/13 16:51:20
Nginx的slice模块可以将一个请求分解成多个子请求,每个子请求返回响应内容的一个片段,让大文件的缓存更有效率。。
  
HTTP Range请求:
HTTP客户端下载文件时,如果发生了网络中断,必须重新向服务器发起HTTP请求,这时客户端已经有了文件的一部分,只需要请求剩余的内容,而不需要传输整个文件,Range请求就可以用来处理这种问题。
  
如果HTTP请求的头部有Range字段,如下面所示:
表示客户端请求文件的第1025到第2048个字节,这时服务器只会响应文件的这部分内容,响应的状态码为206,表示返回是响应的一部分如果服务器不支持Range请求,仍然会返回整个文件,这是状态码200。

 实现原理:

客户端请求100个字节,起始于150,请求内容的范围是150-249。发到nginx之后根据slice配置,比如配置为100,那么就是0-100,100-200,200-300,这样就分为了3块,但是最终这个文件有多大就切分为多少块。之后nginx就会构造两个请求,第一个请求时100-199,然后第二个请求时200-300的。这两个请求返回之后会生成两个文件,第一个100-199,200-299。然后将其组合起来生成客户端要的150-249这样一个响应。
过程总结:以客户端向nginx请求一个10M文件,nginx进行4m的切片为例
  1. 客户端向nginx请求10M;
  2. nginx发起第一个切片(主请求)请求range:0-4194303;
  3. 第一个切片(主请求)请求的内容全部发给客户端后,在slice模块的body_filter发起第二个切片请求(子请求),请求range:4194304-8388607;
  4. 第二个切片请求(子请求)的内容完全发完给客户端后,切回主请求;
  5. 主请求在 slice模块的body_filter发起第三个切片请求(子请求),请求range:8388608-12582911;
  6. 第三个请求(子请求)的内容(8388608-10485759)完全发完给客户端后,切回主请求;
  7. 主请求在slice模块的body_filter判断已经将10M的文件发给客户端,不再进行slice模块的处理。
 
优势:
    每个子请求收到的数据都会形成一个独立文件,这个文件就是通过proxy_cache_key $uri$is_args$args$slice_range;来定位的,也就是说文件跟key有绑定关系。这种将切片缓存为独立文件的方式,还获得了一个额外的优势。就是如果某个片取源连接断掉,那么前面已经缓存的片依然有效。试想一个大文件(在未开启分片的功能下)在最后还有几个字节就收完的时候,连接突然断了,那么前面的内容都会作废,努力全都付诸东流了。这是基于完整文件的缓存模式下,一个很讨厌的问题。
缺点:
    当文件很大或slice很小时,可导致文件描述符耗尽

需要用到nginx的http_slice_module模块,该模块与 1.9.8版本引入。

配置语法:
slice size;
默认:slice 0;
配置块:http、server、location
size 是一个大小,为0的时候表示禁用这个功能,后面跟上一个size表示通过range协议将大文件分解为多个小文件独立的缓存,当客户端发来的请求中已经含有range协议时可以更好的服务。
Nginx配置文件:
比如nginx设置的slice为2M,那么每个分片是2M。
nginx一开始并不知道要发几个range子请求,它会根据配置的slice2m;,先发起一个2m的range请求,这个请求返回的Content-range头会给出文件总长度,这样nginx就知道一共需要发几个range请求来取完所有内容。
假如原始range请求的访问是0.8M-5.3M,即,这个range请求会在nginx内部被转变成r1(0-2M)、r2(2-4M)、r3(4-6M)三子请求 ,顺序分别发送到ats上;
  
slice_range变量
slice_range这个变量作用非常特殊,这个变量的值是当前需要向源服务器请求的分片如果分片的大小为1m,那么最开始变量的值为bytes=0-1048575,通过配置文件中的proxy_set_header Range $slice_range;可以知道取源时请求的Range头部为Range:bytes=0-1048575,源服务器如果支持Range请求,便会返回响应的前1m字节,得到这个响应后slice_range变量的值变为bytes=1048576-2097171 ,再次取源时便会取后1m字节,依次直到取得全部响应内容。

示例

/etc/nginx/conf.d/download.conf
server {
    listen       8081;
    server_name 127.0.0.1;
    location / {
        root /usr/share/nginx/html/;
        index index.html;
    }
}
>>>代理服务器不使用slice模块:/etc/nginx/conf.d/slice.conf
​proxy_cache_path /etc/nginx/cache_slice levels=1:2 keys_zone=slice_cache:10m max_size=10g inactive=60m use_temp_path=off;

server {
    listen       8080;
    server_name  localhost;
    
    #charset koi8-r;
    access_log  /var/log/nginx/slice.log  main;

    location / {
        proxy_cache slice_cache;
        # slice 1m;
        # proxy_cache_key $host$uri$is_args$args$slice_range;
        # proxy_set_header Range $slice_range;
           
        proxy_cache_valid 200 304 12h;
        proxy_cache_valid any 10m;
        add_header Nginx-Cache "$upstream_cache_status";  # 增加一个http响应头信息,Nginx-Cache,告诉客户端是否已经命中代理缓存
        proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504;
        
        proxy_pass http://127.0.0.1:8081;
    }
}
#让客户端使用range协议,-r表示使用range协议会构造range的头部,我只访问 1048565-1048574 即1M里面的10个字节。可以看到返回也确实只有10个字节
访问到上游但是只返回了10个字节,上游究竟发生了什么,192.168.11.135:8081为上游服务器日志
可以看到上游直接返回了2.24M完整的响应(这里我只访问10个字节却给我返回了2.24M),这是nginx做的一个优化,你只是访问了大文件range其中一小部分,但是nginx考虑到一次性向上游取到整个响应内容,后续再访问到其他字节就可以直接使用我的缓存了。
但是如果我们的服务是并发的,同时有多个客户去访问大文件的某一块的话就会引发很严重的问题。很多请求都会去访问一个巨大的文件,这个时候slice模块就有了用武之地。
  
>>>代理服务器使用slice模块:/etc/nginx/conf.d/slice.conf
使用slice该模块需要配置3个地方,slice后面要有一个单位,即分为多大的大小进行切分,如果分的特别小会造成很多文件,如果分的特别大效果就不会特别明显。这里分为1M。
proxy_cache_key   $uri$is_args$args$slice_range ;  $slice_range ,这样才能知道客户端请求的内容是 所少 字节(1M)。
proxy_set_header  Range $slice_range   必须保证我们的 range 这个头部是发到上游的,发送到上游的单位是 1M ,即每次 1M 发往上游。
​proxy_cache_path /etc/nginx/cache_slice levels=1:2 keys_zone=slice_cache:10m max_size=10g inactive=60m use_temp_path=off;

server {
    listen       8080;
    server_name  localhost;
    
    #charset koi8-r;
    access_log  /var/log/nginx/slice.log  main;

    location / {
        proxy_cache slice_cache;
        slice 1m;
        proxy_cache_key $host$uri$is_args$args$slice_range;
        proxy_set_header Range $slice_range;
           
        proxy_cache_valid 200 304 12h;
        proxy_cache_valid any 10m;
        add_header Nginx-Cache "$upstream_cache_status";  # 增加一个http响应头信息,Nginx-Cache,告诉客户端是否已经命中代理缓存
        proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504;
        
        proxy_pass http://127.0.0.1:8081;
    }
}
上游服务器的日志:
可以看到请求现在变为了1M,而不是2.24M.
当上游返回巨大文件的时候,使用slice可以针对如果客户端使用断点续传,多线程下载等等含有range场景。那么slice模块是非常有用的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/646104.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023年网络安全专业的前景怎么样?

网络安全与我们每一个人都息息相关,无论是企业还是个人,现在都非常重视网络安全。而且网络安全是一个新兴的行业,人才需求量远远大于供给,所以在薪资福利上具有很大的优势,并且对于初学者而言,很多人依旧担…

【JVM系列】GC算法介绍

文章目录 概述对象存活判断垃圾收集算法标记 -清除算法复制算法标记-整理算法分代收集算法 概述 垃圾收集 Garbage Collection 通常被称为“GC”,它诞生于1960年 MIT 的 Lisp 语言,经过半个多世纪,目前已经十分成熟了。 jvm 中,程…

企业操作手册有必要弄成在线版本吗?

企业操作手册是对企业运营的各个环节进行详细记录、说明和规范化,以指导企业各类人员在工作中的行为、方法和流程。 下面是编写企业操作手册的基本步骤: 1.明确编写内容。制定编写计划,明确需要编写哪些方面的操作手册和具体内容&#xff0…

抗战时期的15W电台竟能传送到千里之外?

我们大部分人应该都看过谍战影视剧,在剧中不管是敌方、友方还是我方,要想传递情报,基本都是通过无线电台进行联络的。而一旦离开无线电台,谍报人员之间的联络沟通就会变得十分困难。 在电影《永不消逝的电波》中,我们…

Hyper-V管理器无法连接到服务器,Hyper-V主机计算服务无法打开,vmcompute.exe应用程序无法正常启动(0xc0000606)的一种解决方法

Hyper-V无法连接到服务器,发现Hyper-V主机计算服务打不开,然后找到“C:\WINDOWS\System32\vmcompute.exe”,双击报错0xc0000606,用Microsoft 错误查找工具找到是程序不支持“控制流保护(CFG)”,…

vr消防隐患排查软件应用到加油站的好处

传统的隐患辨识排查安全培训方式主要以理论培训为主,现有的实操培训力量较弱且加油站涉及危险环境现有的实操培训难以满足实际需求,如何高效进行加油站安全隐患辨识与排查? 加油站火灾VR安全隐患排查系统是一种基于VR虚拟现实技制作术的智能化安全检查工…

Jmeter自定义函数二次开发

目录 前言: 开发步骤: 前言: JMeter自定义函数是一种使用Java编写的函数,它可以与JMeter脚本一起使用。如果JMeter原始函数不满足您的需求,您可以使用Java编写自定义函数来扩展其功能。 需求:读取本地存…

android 如何分析应用的内存(七)

android 如何分析应用的内存(七) 接上文,介绍六大板块中的第二个————malloc hook 上一篇的自定义分配函数,常常只能解决当前库中的分配,而不能跟踪整个app中的分配。 为此,android的libc库&#xff…

软件测试工程师的核心价值是什么?23年“我“要进阶高级测试...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 与产品、研发相比…

面向制造业的IT管理

制造业的数字化和工业4.0技术的应用,使制造商能够优化生产,转变价值链,创造卓越的客户体验。随着行业采用新的技术,如人工智能(AI)、工业物联网(IIOT)和其他策略,制造商需要找到有效的方法来监控和管理他们的生产环境、…

一文彻底搞懂 Softmax 函数,数学原理分析和 PyTorch 验证

文章目录 1. Softmax 的定义2. Softmax 使用 e 的幂次的作用2.1 代码验证2.2 数学原理分析 3. 解决 Softmax 的数值溢出问题3.1 什么是数值溢出?3.2 解决数值上溢问题: x i − m a x ( x ) x_i-max(x) xi​−max(x)3.3 解决数值下溢问题:log_…

Python篇——数据结构与算法(第六部分:哈希表)

目录 1、直接寻址表 2、直接寻址表缺点 3、哈希 4、哈希表 5、解决哈希冲突 6、拉链法 7、常见哈希函数 8、哈希表的实现 8.1迭代器iter()和__iter__ 8.2str()和repr() 8.3代码实现哈希表 8.4哈…

【数据库】Mysql数据库管理

文章目录 引言一、Mysql数据库管理1. 库和表2. 常用的数据类型3. char和varchar区别 二、SQL语句1. SQL语句分类2. 查看数据库结构3. DDL数据定义语言3.1 创建新的数据库3.2 创建新的表3.3 删除指定数据表3.4 删除指定数据库 4. DML数据操控语言4.1 向数据表中插入新的内容4.2 …

连以太网接口和串口傻傻分不清?看完本文就懂了

概要 路由器是一种网络设备,它的主要功能是在不同的网络之间转发数据包,实现网络互联。路由器根据数据包的目的地址,选择最佳的路径,将数据包发送到下一跳。路由器可以连接不同的网络类型,如以太网、帧中继、PPP等。 …

ChatGPT读PDF、生成思维导图的几种方案

大家好,我是可夫小子,《小白玩转ChatGPT》专栏作者,关注AIGC、读书和自媒体。 日常办公,我们离不开pdf文档读取,思维导图制作,那么ChatGPT能够给我们什么帮助呢? 通常的方法是:我们…

14、Nginx---缓存服务

一、缓存类型 1、服务器端缓存 2、代理缓存 3、客户端缓存 代理缓存的原理: 二、代理缓存配置语法 2.1、代理缓存路径 proxy_cache_path path [levelslevels] [use_temp_pathon|off] keys_zonename:size [inactivetime] [max_sizesize] [manager_filesnumber] [mana…

如何让你的allure报告测试步骤更清晰,更具吸引力?

引言 在软件测试中,清晰的测试步骤对于团队的协作和问题跟踪至关重要,Allure报告是一种强大的工具,能够将测试结果以直观和易于理解的方式呈现给您的团队和客户。 想要让Allure报告更具吸引力和可读性吗?那就不要错过我的精彩建…

MIT6.024学习笔记(三)——图论(2)

科学是使人变得勇敢的最好途径。——布鲁诺 文章目录 通信网络问题二叉树型直径路由器规模路由器数量拥挤程度 二维数组型直径路由器规模路由器数量拥挤程度 蝴蝶型直径路由器规模路由器数量拥挤程度 benes型直径路由器规模路由器数量拥挤 通信网络问题 在通信网络中&#xff…

Redis基础知识(安装基础指令等)

Redis 基础知识 相关资料 官网: https://redis.io/中文地址: http://redis.cn/下载地址: https://redis.io/download 为什么需要Redis 企业需求 高并发 高可用 高性能 海量用户 关系型数据库(如MySQL)-问题 性能瓶颈:磁盘IO 性能低下 扩展瓶颈&#xff1a…

Java基础小项目——【源码】控制台的类似BOSS招聘的一个应聘者用户和公司用户的就业项目【应聘+招聘】

目录 引出题目要求--云就业平台相关的java基础知识项目分层设计 核心业务图解源码总结 引出 类似BOSS招聘的一个应聘者用户和公司用户的就业项目,控制台项目 题目要求–云就业平台 类似BOSS招聘的一个应聘者用户和公司用户的就业项目 第3章 应用系统功能介绍 3…