MongoDB教程(二十一):MongoDB大文件存储GridFS

news2025/1/11 13:00:34

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快!

文章目录

      • 引言
      • 一、GridFS 概述
      • 二、GridFS 的组成
      • 三、使用 GridFS
        • 1. 导入 GridFS 模块
        • 2. 创建 GridFS Bucket
        • 3. 存储文件
        • 4. 检索文件
      • 四、案例:存储和检索图片
        • 1. 创建 GridFS Bucket
        • 2. 存储图片
        • 3. 检索图片
      • 五、GridFS 的优势与局限
        • 优势
        • 局限
      • 六、结论

引言

在处理多媒体文件、文档或其他大型二进制数据时,传统的文件存储方式往往难以满足高并发、可扩展和易管理的需求。MongoDB 通过 GridFS 模块提供了一套完整的解决方案,用于存储和检索大型文件。本文将深入探讨 GridFS 的工作原理,以及如何在 MongoDB 中使用 GridFS 存储和检索文件。

一、GridFS 概述

GridFS 是 MongoDB 的一个规范,用于存储和检索超过 MongoDB 单个文档大小限制(16MB)的文件。GridFS 并不是 MongoDB 的一部分,而是由 MongoDB 社区开发的,旨在提供一种简单、可靠的文件存储方式。GridFS 将文件拆分为多个小块存储,每个小块不超过 255KB,并为每个小块创建一个文档,同时为整个文件创建一个元数据文档。

二、GridFS 的组成

GridFS 主要由两个集合组成:

  • fs.files:存储文件的元数据,如文件名、长度、上传时间等。
  • fs.chunks:存储文件的实际数据,每个文件被拆分为多个小块,每个小块对应 fs.chunks 集合中的一个文档。

三、使用 GridFS

1. 导入 GridFS 模块

在 MongoDB shell 中,可以直接使用 GridFS 功能,但在使用 JavaScript 或其他编程语言的驱动程序时,需要导入相应的 GridFS 模块。

2. 创建 GridFS Bucket

在 MongoDB 3.4 及以后的版本中,引入了 GridFS Bucket,它提供了一个更简洁的 API 来使用 GridFS。

// MongoDB Shell
const fs = new FSBucket(db, { bucketName: "myFiles" });
3. 存储文件

使用 GridFS 存储文件非常直观,可以将文件流或 Buffer 对象传递给 uploadFromStreamuploadFromBuffer 方法。

// MongoDB Shell
const fs = new FSBucket(db, { bucketName: "myFiles" });

// 假设 'file' 是一个文件流
const fileId = await fs.uploadFromStream("myFile.txt", file);
4. 检索文件

检索文件同样简单,可以使用 openDownloadStreamopenDownloadStreamById 方法来获取文件流。

// MongoDB Shell
const fs = new FSBucket(db, { bucketName: "myFiles" });

// 假设 'fileId' 是存储文件时返回的 ID
const readStream = fs.openDownloadStreamById(fileId);

// 读取文件流
let data = [];
readStream.on('data', chunk => data.push(chunk));
readStream.on('end', () => console.log(Buffer.concat(data)));

四、案例:存储和检索图片

假设我们有一个应用,需要存储用户上传的图片,并在需要时能够快速检索和显示这些图片。

1. 创建 GridFS Bucket
const fs = new FSBucket(db, { bucketName: "images" });
2. 存储图片
const fs = new FSBucket(db, { bucketName: "images" });

const image = fs.createWriteStream({ filename: "example.jpg" });
image.write(imageBuffer);
image.end();

这里,imageBuffer 是图片文件的 Buffer 对象。

3. 检索图片
const fs = new FSBucket(db, { bucketName: "images" });

const readStream = fs.openDownloadStreamByName("example.jpg");

// 将文件流转换为 Buffer
let data = [];
readStream.on('data', chunk => data.push(chunk));
readStream.on('end', () => {
    const imageData = Buffer.concat(data);
    // 使用 imageData 显示或处理图片
});

五、GridFS 的优势与局限

优势
  • 可扩展性:GridFS 能够处理任意大小的文件,通过将文件拆分为小块,可以轻松地扩展到大量文件和大文件的场景。
  • 可靠性:即使单个块损坏,也可以通过其他块恢复文件。
  • 元数据:GridFS 允许存储与文件相关的元数据,如文件名、MIME 类型等。
局限
  • 性能:对于小型文件,使用 GridFS 可能不如直接将文件作为二进制数据存储在文档中高效。
  • 复杂性:GridFS 的使用涉及到多个集合和文档,对于简单的文件存储需求,可能显得过于复杂。

六、结论

MongoDB 的 GridFS 提供了一种可靠、可扩展的解决方案,用于存储和检索大型文件。上面介绍了如何在 MongoDB 中使用 GridFS 存储和检索文件。在实际应用中,GridFS 可以满足多媒体应用、文档管理等场景的文件存储需求,同时确保数据的完整性和系统的可扩展性。


喜欢博主的同学,请给博主一丢丢打赏吧↓↓↓您的支持是我不断创作的最大动力哟!感谢您的支持哦😘😘😘
打赏下吧

💝💝💝如有需要请大家订阅我的专栏【MongoDB系列】哟!我会定期更新相关系列的文章
💝💝💝关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!

MongoDB相关文章索引文章链接
MongoDB教程(一):Linux系统安装mongoDB详细教程MongoDB教程(一):Linux系统安装mongoDB详细教程
MongoDB教程(二):mongoDB引用shellMongoDB教程(二):mongoDB引用shell
MongoDB教程(三):mongoDB用户管理MongoDB教程(三):mongoDB用户管理
MongoDB教程(四):mongoDB索引MongoDB教程(四):mongoDB索引
MongoDB教程(五):mongoDB聚合框架MongoDB教程(五):mongoDB聚合框架
MongoDB教程(六):mongoDB复制副本集MongoDB教程(六):mongoDB复制副本集
MongoDB教程(七):mongoDB分片MongoDB教程(七):mongoDB分片
MongoDB教程(八):mongoDB数据备份与恢复MongoDB教程(八):mongoDB数据备份与恢复
MongoDB教程(九):java集成mongoDBMongoDB教程(九):java集成mongoDB
MongoDB教程(十):Python集成mongoDBMongoDB教程(十):Python集成mongoDB
MongoDB教程(十一):MongoDB关系管理与文档关联MongoDB教程(十一):MongoDB关系管理与文档关联
MongoDB教程(十二):MongoDB数据库索引MongoDB教程(十二):MongoDB数据库索引
MongoDB教程(十四):MongoDB查询分析MongoDB教程(十四):MongoDB查询分析
MongoDB教程(十五):MongoDB原子操作MongoDB教程(十五):MongoDB原子操作
MongoDB教程(十六):MongoDB高级索引MongoDB教程(十六):MongoDB高级索引
MongoDB教程(十七):MongoDB主键类型ObjectIdMongoDB教程(十七):MongoDB主键类型ObjectId
MongoDB教程(十八):MongoDB MapReduceMongoDB教程(十八):MongoDB MapReduce
MongoDB教程(十九):MongoDB全文检索MongoDB教程(十九):MongoDB全文检索
MongoDB教程(二十):MongoDB正则表达式MongoDB教程(二十):MongoDB正则表达式

❤️❤️❤️觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄
💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍
🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1947056.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

传输层协议——TCP

TCP协议 TCP全称为“传输控制协议”,要对数据的传输进行一个详细的控制。 特点 面向连接的可靠性字节流 TCP的协议段格式 源/目的端口:表示数据从哪个进程来,到哪个进程4位首部长度:表示该TCP头部有多少字节(注意它…

汽车免拆诊断案例 | 2014 款上汽名爵 GT 车发动机无法起动

故障现象 一辆2014款上汽名爵GT车,搭载15S4G发动机,累计行驶里程约为18.4万km。该车因左前部发生碰撞事故进厂维修,更换损坏的部件后起动发动机,起动机运转有力,但无着机迹象。用故障检测仪检测,发现无法与…

昇思25天学习打卡营第23天 | CycleGAN图像风格迁移互换

昇思25天学习打卡营第23天 | CycleGAN图像风格迁移互换 文章目录 昇思25天学习打卡营第23天 | CycleGAN图像风格迁移互换CycleGAN模型模型结构循环一致损失函数 数据集数据下载创建数据集 网络构建生成器判别器损失函数和优化器前向计算梯度计算与反向传播 总结打卡 CycleGAN模…

W30-python01-Selenium Web自动化基础--百度搜索案例-chrome浏览器为例

原理图 一、下载webdriver--chrome浏览器 根据本机浏览器的版本号下载对应的webdriver版本 http://chromedriver.storage.googleapis.com/index.html 二、安装selenium库 pip install selenium -i Simple Index 三、第一个Web自动化脚本 selenium实现Web自动化的基本步骤&…

基于vue-grid-layout插件(vue版本)实现增删改查/拖拽自动排序等功能(已验证、可正常运行)

前端时间有个需求,需要对33(不一定,也可能多行)的卡片布局,进行拖拽,拖拽过程中自动排序,以下代码是基于vue2,可直接运行,报错可评论滴我 部分代码优化来自于GPT4o和Clau…

Nginx Proxy缓存

Proxy缓存 缓存类型 网页缓存 (公网)CDN数据库缓存 memcache redis网页缓存 nginx-proxy客户端缓存 浏览器缓存 模块 ngx_http_proxy_module 语法 缓存开关 Syntax: proxy_cache zone | off; Default: proxy_cache off; Context: http,…

C语言------指针讲解(3)

一、字符指针 在指针中,我们知道有一类指针类型为字符指针char*; int main() {char ch w;char* pc &ch;*pc w;return 0; } 还有一种使用方式如下: 上述代码中,本质是把hello的首字符的地址放到了pstr中。即把一个常量字符串的首字符…

CMakeList学习笔记

设置项目:project project(planning VERSION 1.0.0 LANGUAGES CXX) # 项目的名字 版本 1.1.0 编程语言 CXX 设置包含目录:include_directories、targer_include_directories 设置编译类型:add_executable、add_library add_executable(demo d…

VMware 上的 Debian Linux 虚拟机无法听到蓝牙耳机的声音解决方案

项目场景: 在Debian上安装QQ音乐,用来摸鱼 问题描述 在安装完QQ音乐后,发现虚拟机无法听到声音,音乐有在正常播放,但是蓝牙耳机没有听到任何声音: 原因分析: 感觉是虚拟机的声卡没有配置&…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] 开源项目热度排行榜(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆Coding ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试D卷目录,全、新、准,题目覆盖率达 95% 以上,支持题目在线评测,专栏文章质量平均 93 分 最新华为OD机试目录…

VScode 批量操作

VScode 批量操作 批量修改 按住 alt/option 键, 选择需要批量操作的位置 如果是多行,则按住 altshift 键 可以直接操作 但是有时候比如变量命名,可能需要递增操作的命名 需要下载插件 Increment Selection 按照1的方法多选光标之后&am…

Qemu virtio-blk 后端驱动开发 - PureFlash对接

本文以PureFlash为例,介绍了如何将一个新的存储类型对接到qemu虚拟化平台下,为虚机提供存储能力。 关于virtio-blk以及其工作原理这里就不介绍了,网上有很多分析的文章。总之就是如果我们想给虚机提供一种新的存储类型(不同于标准…

解决显存不足问题:深度学习中的 Batch Size 调整【模型训练】

解决显存不足问题:深度学习中的 Batch Size 调整 在深度学习训练中,显存不足是一个常见的问题,特别是在笔记本等显存有限的设备上。本文将解释什么是 Batch Size,为什么调整 Batch Size 可以缓解显存不足的问题,以及调…

大数据-48 Redis 通信协议原理RESP 事件处理机制原理 文件事件 时间事件 Reactor多路复用

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

鸿蒙开发仓颉语言【Hyperion: 一个支持自定义编解码器的TCP通信框架】组件

Hyperion: 一个支持自定义编解码器的TCP通信框架 特性 支持自定义编解码器高效的ByteBuffer实现,降低请求处理过程中数据拷贝自带连接池支持,支持连接重建、连接空闲超时易于扩展,可以积木式添加IoFilter处理入栈、出栈消息 组件 hyperio…

c++ 求解质因数

定义 这里先来了解几个定义(如已了解,可直接看下一个板块) 因数:又称为约数,如果整数a除以整数b(b0)的商正好是是整数而没有余数,我们就说b是a的因数 质数:又称为素数…

我在Vscode学Java泛型(泛型设计、擦除、通配符)

Java泛型 一、泛型 Generics的意义1.1 在没有泛型的时候,集合如何存储数据1.2 引入泛型的好处1.3 注意事项1.3.1 泛型不支持基本数据类型1.3.2 当泛型指定类型,传递数据时可传入该类及其子类类型1.3.3 如果不写泛型,类型默认是Object 二、泛型…

Python酷库之旅-第三方库Pandas(044)

目录 一、用法精讲 151、pandas.Series.any方法 151-1、语法 151-2、参数 151-3、功能 151-4、返回值 151-5、说明 151-6、用法 151-6-1、数据准备 151-6-2、代码示例 151-6-3、结果输出 152、pandas.Series.autocorr方法 152-1、语法 152-2、参数 152-3、功能 …

c++树(三)重心

目录 重心的基础概念 定义:使最大子树大小最小的点叫做树的重心 树的重心求解方式 例题: 重心的性质 性质1:重心点的最大子树大小不大于整棵树大小的一半。 性质1证明: 性质1的常用推导 推导1: 推导2&#x…

《Milvus Cloud向量数据库指南》——开源许可证的范围:深入解析与选择指南

在开源软件的广阔天地中,开源许可证作为连接开发者与用户之间的重要法律桥梁,其类型多样且各具特色。每一种许可证都精心设计了特定的权限、限制和要求,旨在保护创作者的权益,同时促进软件的创新与共享。对于开发者和用户而言,深入理解并恰当选择适合的开源许可证,是确保…