protobuf实现原理

news2024/12/25 21:14:43

文章目录

    • 一、前言
    • 二、概述
    • 三、数据存储方式:Varints
      • (一)原理
      • (二)举例
      • (三)缺点
    • 四、协议的数据结构
      • (一)原理
      • (二)举例

一、前言

最近刚刚从一家公司离职,在职的时候使用到了go语言的grpc库,了解了除了json之外的另一个专门用于远程调用的序列化工具protobuf。protobuf是Google开源的一款支持跨平台、语言中立的结构化数据描述和高性能序列化协议,此协议完全基于二进制,所以性能要远远高于JSON/XML。由于出色的传输性能因此常见于微服务之间的通讯,其中最为著名的是Google开源的 gRPC 框架,下面来谈一谈它的原理。

二、概述

  • protobuf将消息里的每个字段进行编码后,再利用T-L-V或者T-V的方式进行数据存储。
  • protobuf对于不同类型的数据会使用不同的编码和存储方式。
  • protobuf的编码和存储方式是其性能优越、数据体积小的原因。
    所以问题也就很明确了,只需要了解对于不同的数据类型,protobuf是怎么编码的,怎么存储的就可以了。

三、数据存储方式:Varints

(一)原理

Varints是一个变长保存数据的方法,在C++中一个整型数字通常使用4个字节来保存即int类型。但是对于Varints来说,小于128的数字可以使用一个字节来表示,而大于128的数字才会使用多个字节来表示。
下面来讲解它是怎么约束的:
在Varints编码中,它的每个字节的最高比特位有一定的含义,如果是1的话那么表示它后面的字节也是该数字的一部分,剩余的其他7个比特位才代表数字,这个思想和IP报文的分片挺相似的。所以就很容易理解为什么小于128的数字可以使用一个字节来表示了,因为第一位被占用了。

(二)举例

举两个例子:
表示65这个数字:
在这里插入图片描述
此时第一位为0,表示下面的字节和这个字节表示的数字不是同一个数字了。
表示300这个数字:
在这里插入图片描述
这里使用的是大端存储,高位低地址,低位高地址。第一个字节为1,表示它下一个字节存的数字和当前存的数字是同一个数字。

(三)缺点

这种存储方式对于小的数字比较友好,可以使用更少的字节数去存储,但对于大的数字就不太友好了。有的数字可能4个字节就可以搞定被生生存了5个字节。所以在protobuf中使用更小的数字才是效率更高的。
在协议的数据结构中,key使用的是varint编码,因此索引字段从1开始而不是负数,因为负数存的是补码通常占位比较多,影响了效率。

四、协议的数据结构

(一)原理

消息在经过序列化后会形成一个二进制数据流,流中数据为一系列的K-V对,Value怎么存上面已经介绍过了,这里介绍Key。
首先我们需要明确的是protobuf要存什么,一个是数据,也就是value,一个是key也就是索引字段,当我们使用protobuf定义一个message的时候通常是这样的:

message mystruct
{
	int32 a=1;
	int32 b=2;
}

其中1和2表示的是索引字段,它们具体的值就是value。
key除了作为value的索引之外,还需要指定value的编码格式,注意这里key使用的是varint的编码格式,但是不代表数据就使用该格式。
key值的计算公式为: (field_number << 3) | wire_type,其中field_number为索引字段,wire_type表示的是数据的格式,它的格式分五种:
在这里插入图片描述
其实就只有五种,所以我们就知道了为什么它向左移动三位来为存放数据类型腾出空间。

(二)举例

举一个简单的例子:

message Test1 {
    required int32 a = 1;
}

通过查表可以知道,int32类型即该字段是使用varint编码格式来存储的,所以计算key为:
(1<<3)|0
同时由于存储key使用的是varint编码,因此第一位为结束符,这里的索引使用一个字节就可以了,因此结束符是0:
在这里插入图片描述
假设要传入的a的值是1,则a使用varint编码表示为:
在这里插入图片描述
此时就弄出来了一个字段的kv结构。而一个message有很多个字段,它们的排列是线性的:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/628224.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

二本计算机专业学长经验之谈

2023.6.9 今年的行情对我们这些双非大学、二本真的太难了&#xff0c;菜鸟今年感觉毕业找的工作真的又苦逼钱又少&#xff0c;准备跳槽的&#xff0c;结果满大街投简历&#xff0c;连个毛都没有&#xff0c;唯一一个给了个海笔&#xff0c;然后就没然后… 所以希望大家真的要好…

Element的Select分组全选模式

Select 选择器选择器的分组&#xff0c;如上图所示&#xff0c;我们希望做到的效果是&#xff0c;点击“热门城市”或“城市名”的时候全选分组的options。 思路 思路一&#xff1a;目前的Select 选择器分组OptionGroup的Title只是一个文本DOM&#xff0c;没用其他东西&#…

详解基于罗德里格斯(Rodrigues)公式由旋转向量到旋转矩阵的 Python 实现

文章目录 旋转向量 rotation vector旋转矩阵 rotation matrix罗德里格斯公式 Rodrigues formula基于 Python 和 NumPy 实现 Rodrigues 公式 旋转向量 rotation vector 任何一个旋转都可以通过一个 旋转轴 加一个 旋转角 进行描述, 即围绕 旋转轴 旋转一个 旋转角. 此时可以通过…

javascript 中的 URL 解码

文章目录 需要URL编解码JavaScript 中的 URL 解码使用 unescaped() 方法解码编码的 URL使用 decodeURI() 方法解码编码的 URL使用 decodeURIComponent() 方法解码编码的 URL 总结 本文着眼于 URL 解码以及如何使用 JavaScript 对编码的 URL 进行解码。 需要URL编解码 URL 应具…

政企HTTPS加密国产化替代的四要素

信创产业是数字经济、信息安全发展的基础&#xff0c;也是“新基建”的重要内容&#xff0c;将成为拉动中国经济增长的重要抓手之一。随着国资委79号文的发布&#xff0c;国央企落实信息化系统的信创国产化改造的步伐加快&#xff0c;贯彻“28N”战略&#xff0c;从党政机关扩展…

Doris学习笔记

1.数据模型 数据模型 - Apache Doris 1.1 Aggregate 模型(聚合&#xff09; 可以发现&#xff0c;user_id、date、age ...等没有设置 AggregationType, 那么这几个字段就成了一个key了。设置了 AggregationType 字段&#xff0c;说明该列的属性已经成value了。 我们导入一张…

Linux·Binder机制原理

目录 前言 目录 1. Binder到底是什么&#xff1f; 2. 知识储备 2.1 进程空间划分 2.2 进程隔离 & 跨进程通信&#xff08; IPC &#xff09; 2.5 内存映射 3. Binder 跨进程通信机制 模型 3.1 模型原理图 3.3 模型原理步骤说明 3.4 额外说明 4. Binder机制 在An…

自学黑客(网络安全),一般人我劝你还是算了

写在开篇 笔者本人 17 年就读于一所普通的本科学校&#xff0c;20 年 6 月在三年经验的时候顺利通过校招实习面试进入大厂&#xff0c;现就职于某大厂安全联合实验室。 我为啥说自学黑客&#xff0c;一般人我还是劝你算了吧&#xff01;因为我就是那个不一般的人。 ​ 首先我…

elementui tree 支持虚拟滚动和treeLine (下)

​ 由于我之前没有发布过npm 包&#xff0c;这里还得现学一下。 参考资料&#xff1a; 链接: 如何写一个vue组件发布到npm&#xff0c;包教包会&#xff0c;保姆级教学链接: vue组件发布npm最佳实践 按照上面的步骤&#xff0c;我通过 vue-sfc-rollup 生成了项目&#xff0c;…

六级备考8天|CET-6|阅读强化|16:00~17:20

调整做题顺序&#xff1a;仔细阅读——>长篇阅读(信息匹配)——>翻译——>选词填空 顺关系 or 反关系 正态度 or 负态度 阅读要有针对性 理解要有空白性 2&#xff09;高大上的思维来自于中文的语言特点 练习 第一段&#xff1a;例子&#xff0c;无观点&am…

微伴助手如何增加客户积分?如何自动给客户添加企业标签?

微伴助手是一款企业微信第三方应用&#xff0c;已经为电商、教育、金融、保险、医疗等机构提供技术支持&#xff0c;适用于引流获客、客户意向跟进、销售转化、社群运营等全方位营销场景&#xff0c;旨在帮助企业构建高转化率的私域流量池。 微伴助手基于企业微信开放的接口&a…

adb shell 调试 Android 串口 百度AI也很

在 Android 平台上进行串口调试需要使用 Android Debug Bridge (ADB) 工具。ADB 是一个命令行工具&#xff0c;可以通过 USB 连接 Android 设备&#xff0c;并执行各种命令来调试应用程序。 以下是使用 ADB shell 进行 Android 串口调试的步骤&#xff1a; 连接 Android 设备…

【2023最全教程】什么是自动化测试框架?熬夜7天整理出这一份3000字超全学习指南

所有软件在提供给用户之前都必须经过测试。软件测试是开发生命周期中必不可少的一步因为它确保用户必须收到符合其开发目的的高质量产品。每个企业都优先考虑测试;因此&#xff0c;大多数人更愿意从手动测试转向自动化。因此&#xff0c;自动化测试框架是任何软件测试过程的基础…

安全测试网站-DWVA下载安装启动

参考&#xff1a;DVWA下载、安装、使用&#xff08;漏洞测试环境搭建&#xff09;教程 - 付杰博客 (fujieace.com) DVWA全称为Damn Vulnerable Web Application&#xff0c;意为存在糟糕漏洞的web应用。它是一个基于PHP/MySQL开发的存在糟糕漏洞的web应用&#xff0c;旨在为专…

华为OD机试真题B卷 Java 实现【自守数】,附详细解题思路

一、题目描述 自守数是指一个数的平方的尾数等于该数自身的自然数。例如&#xff1a;25^2 625&#xff0c;76^2 5776&#xff0c;9376^2 87909376。请求出n(包括n)以内的自守数的个数。 数据范围&#xff1a; 1≤n≤10000 二、输入描述 int型整数。 三、输出描述 n以内…

看板可视化工作流的7个步骤

工作流是任务或产品从工作开始到完成所经历的一系列特征步骤。 人脑处理视觉图像的能力比文本快 60,000 倍&#xff0c;这意味着我们消费图像等视觉内容的速度比文本快得多。在看板中&#xff0c;工作流的可视化意味着将独特的工作步骤映射到看板的列中&#xff0c;并在工作项…

【数据结构与算法】02 栈 (栈的多重含义,静态、动态数组栈(顺序栈),链式栈,双端栈,括号匹配)

一、栈的多重含义1.1 硬件栈1.2 运行时栈1.3 软件栈1.4 技术栈1.5 TCP/IP协议栈 二、数据结构中的栈2.1 概念2.2 栈的操作2.3 数组栈&#xff08;顺序栈&#xff09;2.31 数组栈特性2.32 C语言实现▶ 静态数组栈▶ 动态数组栈 2.4链式栈2.41 链式栈特性2.42 C语言实现 三、进阶…

【2023最新教程】一文3000字从0到1教你做app自动化测试(保姆级教程)

一、什么是App自动化&#xff1f;为什么要做App自动化&#xff1f; App自动化是指给 Android或iOS上的软件应用程序做的自动化测试。手工测试和自动化测试的对比如下&#xff1a; 手工测试优势&#xff1a;不可替代、发现更多bug、包含了人的想象力与理解力。 注意&#xff0c…

嵌入式 - UART介绍

概述 嵌入式系统经常需要集成电路之间的通信。举个例子&#xff0c;一个数字温度传感器向主控芯片报告房间的环境温度。通常情况&#xff0c;这种数据会通过一个串行接口来传输。 那么&#xff0c;什么是串行接口&#xff1f; 在最基本的角度来说&#xff0c;串行接口是一个移…

微信原生小程序自定义顶部导航

都2023了&#xff0c;自定义顶部导航应该不是什么新鲜事了&#xff0c;这里只是简单记录下 微信自己也提供了自定义顶部导航navigation-bar&#xff0c;大概看了下&#xff0c;可配置的也不少&#xff0c;所以看需求了&#xff0c;如果简单可以采用微信提供的&#xff0c;老规矩…