MongoDB-BSON 协议与类型

news2024/12/27 10:33:15

主页.png

前言:

MongoDB 是一个高性能、无模式的 NoSQL 数据库,广泛应用于大数据处理和实时数据存储。作为一个数据库系统,MongoDB 的核心之一就是其使用的 BSON(Binary JSON)格式,它用于存储数据以及在客户端和数据库之间传输数据。

什么是 BSON?

BSON(Binary JSON)是一种用于数据存储和交换的二进制格式。它是 JSON 格式的扩展,提供了对更复杂数据类型的支持。BSON 的设计目标是提供一种轻量级的、具有高效二进制编码的方式来存储和传输数据,尤其是针对 MongoDB 的存储需求。

BSON 与 JSON 的差异

尽管 BSON 是 JSON 的二进制扩展,它们之间有若干重要差异:

1、二进制格式:BSON 采用二进制格式,这使得它比 JSON 更加紧凑,存储和传输效率更高。
2、数据类型支持:BSON 支持 JSON 不支持的一些数据类型,例如二进制数据、日期类型、正则表达式等。
3、自描述结构:BSON 格式本身包含字段的类型信息,读取时无需额外的解析。
4、大小和性能:由于 BSON 是二进制格式,相较于 JSON(纯文本),它在存储和读取时通常具有更高的性能和更小的占用空间。

BSON 数据类型

BSON 提供了许多扩展 JSON 数据类型,满足 MongoDB 数据库对数据表示和存储的需求。以下是 BSON 支持的一些常见数据类型。

1. Null (null)
  • 描述:表示一个空值或无效值,类似于 JSON 中的 null。

  • 示例:
    javascriptCopy Code

    { “field”: null }

2. 布尔值 (Boolean)
  • 描述:BSON 使用 true 或 false 来表示布尔值。

  • 示例:
    javascriptCopy Code

    { “isActive”: true }

3. 整数类型 (Int32 和 Int64)
  • 描述:BSON 支持两种整数类型:32位整数 (Int32) 和 64位整数 (Int64),分别表示较小和较大的整数。MongoDB 自动根据数据的范围选择存储形式。

  • 示例:
    javascriptCopy Code

    { “age”: 25 } // 默认为 Int32
    { “timestamp”: NumberLong(“1622549093000”) } // Int64

4. 浮动类型 (Double)
  • 描述:BSON 使用 64 位的 IEEE 754 双精度浮动值表示浮动类型。适用于需要高精度的计算或存储。

  • 示例:
    javascriptCopy Code

    { “price”: 99.99 }

5. 字符串 (String)
  • 描述:BSON 中的字符串是 UTF-8 编码的文本数据类型,类似于 JSON 中的字符串。

  • 示例:
    javascriptCopy Code

    { “name”: “MongoDB” }

6. 二进制数据 (BinData)
  • 描述:BSON 支持存储二进制数据,通常用于存储图像、音频等非文本数据。

  • 示例:
    javascriptCopy Code

    { “file”: BinData(0, “binarydata”) }

7. 日期 (Date)
  • 描述:BSON 使用 64 位整数来表示日期和时间,精确到毫秒。

  • 示例:
    javascriptCopy Code

    { “createdAt”: new Date() }

8. 对象Id (ObjectId)
  • 描述:ObjectId 是 MongoDB 的默认主键类型。它是一个 12 字节的唯一标识符,生成方式基于时间戳、机器 ID、进程 ID 和一个随机数。

  • 示例:
    javascriptCopy Code

    { “_id”: ObjectId(“507f1f77bcf86cd799439011”) }

9. 数组 (Array)
  • 描述:BSON 允许在一个字段中存储多个值,这些值可以是任何类型。与 JSON 数组类似。

  • 示例:
    javascriptCopy Code

    { “tags”: [“database”, “NoSQL”, “MongoDB”] }

10. 嵌套文档 (Embedded Document)
  • 描述:BSON 支持嵌套文档(即文档中的文档),允许存储复杂的结构化数据。

  • 示例:
    javascriptCopy Code

    {
    “address”: {
    “street”: “123 Main St”,
    “city”: “New York”
    }
    }

11. 正则表达式 (RegEx)
  • 描述:BSON 支持存储正则表达式,这是 JSON 不具备的功能。在 MongoDB 中,正则表达式常用于模式匹配查询。

  • 示例:
    javascriptCopy Code

    { “pattern”: /abc/i }

  1. JavaScript 代码 (JavaScript)
  • 描述:BSON 支持存储 JavaScript 代码,可以包含函数和脚本,通常用于动态计算和操作。

  • 示例:
    javascriptCopy Code

    { “code”: function() { return 42; } }

13. 最小值/最大值 (MinKey 和 MaxKey)
  • 描述:MinKey 和 MaxKey 是 BSON 中的特殊类型,分别表示最小值和最大值,常用于在查询中进行极限值比较。

  • 示例:
    javascriptCopy Code

    { “minValue”: MinKey }
    { “maxValue”: MaxKey }

BSON 编码与解码

BSON 在存储数据时以二进制的形式进行编码,使得数据能够高效存储和传输。当客户端或服务器需要与数据库交互时,它们会将 BSON 数据进行编码和解码。MongoDB 提供了内置的序列化和反序列化机制,使用如 bson 库来处理 BSON 格式的编码和解码。

编码过程:

类型描述:每个 BSON 文档的每个字段都有类型描述符,指示该字段的数据类型。
键和值对:每个字段都由一个键(字符串类型)和一个值(可以是任何 BSON 支持的数据类型)组成。
文档结束符:BSON 文档以一个特定的结束符标记结束,确保数据结构完整性。

解码过程:

读取类型:在解码时,MongoDB 根据类型描述符来确定字段值的数据类型。
返回文档:解码后的 BSON 数据将转化为 JavaScript 对象或其他语言的对应数据结构。

BSON 协议与性能优化

MongoDB 使用 BSON 协议来优化性能,尤其是在读写性能和存储效率方面。与 JSON 相比,BSON 提供了更小的存储空间和更快的读取速度。通过支持二进制数据和日期类型等,BSON 能够有效存储各种应用场景中的数据。

压缩与存储:BSON 支持多种优化存储方式,包括压缩技术,这使得它在大数据量处理时更加高效。
索引优化:由于 BSON 格式的文档结构灵活,MongoDB 可以根据数据字段进行高效索引,提升查询性能。

结论

BSON 协议是 MongoDB 数据存储和传输的核心,它结合了高效的二进制编码、丰富的数据类型和灵活的存储结构。通过支持多种数据类型,BSON 使得 MongoDB 在处理各种复杂数据时非常高效。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2253457.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jmeter如何导出中文版的测试报告?

文章目录 0、初始步骤:把报告模板换成中文形式1、首先添加一份聚合报告2、然后点开【聚合报告】3,生成报告3.1 选择【工具】-【generate HTML report】3.2 【generate HTML report】参数详解3.3 、最后点击 【generate report】直接生成。 声明&#xff…

等差数列末项计算

等差数列末项计算 C语言代码C 代码Java代码Python代码 💐The Begin💐点点关注,收藏不迷路💐 给出一个等差数列的前两项a1,a2,求第n项是多少。 输入 一行,包含三个整数a1,a2&#x…

芯科科技突破性超低功耗Wi-Fi 6和低功耗蓝牙5.4模块加速设备部署

致力于以安全、智能无线连接技术,建立更互联世界的全球领导厂商Silicon Labs(亦称“芯科科技”,今日宣布推出SiWx917Y超低功耗Wi-Fi 6和低功耗蓝牙(Bluetooth LE)5.4模块。 作为成功的第二代无线开发平台的新产品&…

Golang内存模型总结1(mspan、mcache、mcentral、mheap)

1.内存模型 1.1 操作系统存储模型 从上到下分别是寄存器、高速缓存、内存、磁盘,其中越往上速度越快,空间越小,价格越高。 关键词是多级模型和动态切换 1.2 虚拟内存与物理内存 虚拟内存是一种内存管理技术,允许计算机使用比…

重生之我在异世界学编程之C语言:操作符篇

大家好,这里是小编的博客频道 小编的博客:就爱学编程 很高兴在CSDN这个大家庭与大家相识,希望能在这里与大家共同进步,共同收获更好的自己!!! 本文目录 引言正文1. 算术操作符2. 关系&#xff0…

深度学习图像增强介绍

目录 一、引言二、常用数据增广方法三、图像变换类3.1 AutoAugment3.2 RandAugment 四、图像裁剪类4.1 Cutout4.2 RandomErasing4.3 HideAndSeek 五、图像混叠5.1 Mixup5.2 Cutmix 六、结论 一、引言 在图像分类任务中,图像数据的增广是一种常用的正则化方法&#…

HBU深度学习实验14-循环神经网络(1)

前言,预备知识 循环神经网络(Recurrent Neural Network,RNN)是一类具有短期记忆能力的神经网络.在循环神经网络中,神经元不但可以接受其他神经元的信息,也可以接受自身的信息,形成具…

使用GDI对象绘制UI时需要注意的若干细节问题总结

目录 1、一个bitmap不能同时被选进两个dc中 2、CreateCompatibleDC和CreateCompatibleBitmap要使用同一个dc作为参数 3、不能删除已经被选入DC中的GDI对象 4、使用完的GDI对象,要将之释放掉,否则会导致GDI对象泄漏 5、CreateCompatibleBitmap返回错…

【Java-数据结构篇】Java 中栈和队列:构建程序逻辑的关键数据结构基石

我的个人主页 我的专栏:Java-数据结构,希望能帮助到大家!!!点赞❤ 收藏❤ 一、引言 1. 栈与队列在编程中的角色定位 栈和队列作为两种基本的数据结构,在众多编程场景中都有着独特的地位。它们为数据的有序…

洛谷P2670扫雷游戏(Java)

三.P2670 [NOIP2015 普及组] 扫雷游戏 题目背景 NOIP2015 普及组 T2 题目描述 扫雷游戏是一款十分经典的单机小游戏。在 n 行 m列的雷区中有一些格子含有地雷(称之为地雷格),其他格子不含地雷(称之为非地雷格)。玩…

vue2:Cascader 级联选择器中加载两种不同的数据结构

前言 因UI调整,需要将el-tree控件更换为级联选择器,而在原树形控件中,加载了两种不同的数据结构,(参见vue2:树形控件el-tree中加载两种不同结构的数据_vue2 树形插件-CSDN博客)所以现在级联选择器中也需要加载这两种不同的数据结构。 问题 原本以为处理方式差不多,在…

【10】MySQL中的加密功能:如何使用MD5加密算法进行数据加密

文章目录 1. MySQL加密功能概述2. MD5加密算法3. 在MySQL中使用MD5加密4. 使用更安全的加密方法总结 在现代的数据库应用中,数据的安全性和隐私性变得尤为重要。无论是存储用户的个人信息,还是保护敏感的业务数据,确保这些数据不会被未授权访…

【SARL】单智能体强化学习(Single-Agent Reinforcement Learning)《纲要》

📢本篇文章是博主强化学习(RL)领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅…

前端上传后端接收参数为null

记录一下工作中的问题 前端明明把文件传到后台了,但是后台接收参数为null 原因: 前端上传文件的name和后端接收参数名称不匹配 前端 后端 把前端上传的name由upfile改为file即可 本来是很基本的小问题,但因为自己钻了牛角尖一直没搞定&…

Clickhouse MergeTree存储引擎

文章目录 MergeTree特点MergeTree核心参数- ORDER BY- PARTITION BY- PRIMARY KEY- SAMPLE BY- TTL- SETTINGS- index_granularity- index_granularity_bytes- min_index_granularity_bytes- enable_mixed_granularity_parts- use_minimalistic_part_header_in_zookeeper- min_…

【机器学习】—Transformers的扩展应用:从NLP到多领域突破

好久不见!喜欢就关注吧~ 云边有个稻草人-CSDN博客 目录 引言 一、Transformer架构解析 (一)、核心组件 (二)、架构图 二、领域扩展:从NLP到更多场景 1. 自然语言处理(NLP) 2…

【算法】【优选算法】位运算(下)

目录 一、:⾯试题 01.01.判定字符是否唯⼀1.1 位图1.2 hash思路1.3 暴力枚举 二、268.丢失的数字2.1 位运算,异或2.2 数学求和 三、371.两整数之和四、137.只出现⼀次的数字 II五、⾯试题 17.19.消失的两个数字 一、:⾯试题 01.01.判定字符是…

深度学习中注意力机制介绍及seq2seq案例

一. 注意力机制介绍 普通机器翻译 图中表示的是一个中文到英文的翻译:欢迎 来 北京 → welcome to BeiJing。编码器首先处理中文输入"欢迎 来 北京",通过GRU模型获得每个时间步的输出张量,最后将它们拼接(按位相加)成一个中间语义张…

工业—使用Flink处理Kafka中的数据_ChangeRecord2

使用 Flink 消费 Kafka 中 ChangeRecord 主题的数据,每隔 1 分钟输出最近 3 分钟的预警次数最多的 设备,将结果存入Redis 中, key 值为 “warning_last3min_everymin_out” , value 值为 “ 窗口结束时间,设备id” &am…

Android 消息队列之MQTT的使用:物联网通讯,HTTP太重了,使用MQTT;断网重连、注册、订阅、发送数据和接受数据,实现双向通讯。

目录: 问题MQTT是什么以及为什么使用如何使用:第一阶段、基础功能如何使用:第二阶段、增加断网重连如何使用:第三阶段、封装 一、问题 在开发的时候,我们一般都使用Http和后台进行通讯,比如我们是开发物联…