json 压缩算法详解

news2026/2/14 6:12:20

概要

无论使用何种编程语言，json格式的数据已被广泛应用，不论是数据的传输还是存储，在很多应用场景下，你可能想进一步地压缩JSON字符串的长度，以提升传输效率，如果你使用的是nosql数据库，你可能想进一步的压缩json字符串的长度来节省你的存储空间，接下来，我将介绍一下目前最常用的json数据压缩技术（CJSON和HPack）的实现

一、 CJSON

CJSON 的压缩算法, 主要是将资料抽离成 Template 与 Value,节省掉重复的 "Key 值".

原数据：

[{
  "x": 100,
  "y": 100
 }, {
  "x": 100,
  "y": 100,
  "width": 200,
  "height": 150
 }
]

压缩之后：

{
 "templates": [
  [0, "x", "y"],
  [1, "width", "height"]
 ],
 "values": [{
  "values": [1, 100, 100]
 }, {
  "values": [2, 100, 100, 200, 150]
 }, {}]
}

二、HPack

HPack 的压缩算法, 也是将 Key, Value 抽离, 阵列中第一个值, 就是 HPack 的 Template, 后面依序就是 Value.

原数据：

[{
 "name": "Andrea",
 "age": 31,
 "gender": "Male",
 "skilled": true
}, {
 "name": "Eva",
 "age": 27,
 "gender": "Female",
 "skilled": true
}, {
 "name": "Daniele",
 "age": 26,
 "gender": "Male",
 "skilled": false
}]

压缩之后：

[
 ["name", "age", "gender", "skilled"],
 ["Andrea", 31, "Male", true],
 ["Eva", 27, "Female", true],
 ["Daniele", 26, "Male", false]
]

彩蛋

经过上述的介绍，都是按照json格式的方式经尽可能的压缩，但是有没有一种压缩比更高的做法呢，例如json 格式中的大中括号冒号逗号之类的东西都可以去掉，但是又需要能够携带各种数据类型和字段结构，protocol buffer协议了解下？

Protocol Buffer 和 XML、JSON一样都是结构数据序列化的工具，但它们的数据格式有比较大的区别：
- 首先，Protocol Buffer 序列化之后得到的数据不是可读的字符串，而是二进制流
- 其次，XML 和 JSON 格式的数据信息都包含在了序列化之后的数据中，不需要任何其它信息就能还原序列化之后的数据；但使用 Protocol Buffer 需要事先定义数据的格式(.proto 协议文件)，还原一个序列化之后的数据需要使用到这个定义好的数据格式
- 最后，在传输数据量较大的需求场景下，Protocol Buffer 比 XML、JSON 更小（3到10倍）、更快（20到100倍）、使用 & 维护更简单；而且 Protocol Buffer 可以跨平台、跨语音使用例如：

原数据：

{
  name : "Andrea",
  age : 31,
  gender : "Male",
  skilled : true
}

压缩后的示意图如下：

压缩之后的数据变成了一串二进制数据，其中 name 和 gender 由于是 string 类型，长度不定，故使用他们的第一个四位数作为表示这个该name 对应值“Andrea”的二进制长度，其他类型的数据取值如下图的API：

这样的做法可以被认为是一种加密性质的压缩，如果数据接收方不知道数据结构，是无法直接解析出目标值的。需要数据发送发和数据接收方约定好字段的结构。

从上面的例子中，我们发现，CJSO和HPack 都只是节省了 json数据键的大小，但是里面的中括号和引号都无用且大量冗余，我上面介绍的这种压缩方法使用起来复杂度可能高一点，但是压缩比可以比上面的两种更好一些，不管是作为存储还是作为数据的传输，都可以节省大量的资源。

欢迎点赞收藏转发，感谢🙏

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/709932.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

json 压缩算法详解

概要

一、 CJSON

二、HPack

彩蛋

相关文章

2012年全国硕士研究生入学统一考试管理类专业学位联考逻辑试题——纯享题目版

记一次tomcat版本升级导致的现网问题

闲人闲谈PS之四十二——顾问的“禁忌之地”—制造能力计划

什么条件下会出现死锁，如何避免？

图像的算术操作

773. 滑动谜题

怎么管理好一个团队？

js vuejs dagre-d3绘制流程图实用指南有向图可视化

idea tomcat js 汉字乱码

服务第七章

基于Tars高并发IM系统的设计与实现-基础篇1

裂墙推荐！阿里大牛新产Java面试速成指南，主打就是躺着拿Ofeer

移动端数据可视化设计

uview-plus上传图片，upload组件带参数上传

03双向链表

python+requests库使用时报错：ssl.SSLError: [SSL: WRONG_VERSION_NUMBER] wrong version number (_ssl.c:1131)

BUUCTF 世上无难事 1

三层交换机实现不同VLAN的数据转发

Mybatis - 统计SQL执行时间

C语言初阶之结构体