前面两篇博客
varint原理 - 正数的编码和解码_YZF_Kevin的博客-CSDN博客
varint原理 - 负数的编码和解码_YZF_Kevin的博客-CSDN博客
我们分析了varint对正数,负数的编码解码方式,也知道了如果用varint表示负数的坑,那就是负数直接占10个字节,比一般的int32占的字节还多几倍。其实protobuf针对这个坑已经做了优化,那就是zigzag编码
这篇博客我们具体分析下zigzag编码的实现
先说原理
zigzag编码的本质,是把负数按照一定的规则转换成一个正数,然后再按照varint的方式编码
原始数据 | zigzag数据 |
0 | 0 |
-1 | 1 |
1 | 2 |
-2 | 3 |
2 | 4 |
2147483647 | 4294967294 |
-2147483648 | 4294967295 |
总结zigzag编码公式( 下面的 |数据| 是求数据绝对值的意思 )
当数据为0时,zigzag编码也为0
当数据为负数时,zigzag编码 = |数据| * 2 - 1
当数据为正数时,zigzag编码 = |数据| * 2
做实验
proto协议文件如下:前两个元素都是sint32,第三个元素还是int32
// 玩家信息
message Player {
sint32 uniNum = 1;// 唯一序号
sint32 score = 2;// 成绩
int32 age = 3;// 年龄
}
特别看下编译出来的pb文件
程序如下:对两个sint32元素分别赋值 -3 和 5,int32赋值为5仅做对比用
package main
import (
"fmt"
"github.com/golang/protobuf/proto"
)
func main() {
p := &Player {
UniNum: -3,
Score: 5,
Age: 5,
}
b, _ := proto.Marshal(p)
fmt.Printf("%08b \n", b)
}
实验结果如下
解释下
第一个sint32元素,原始值为-3,根据公式zigzag编码值 = |-3| * 2 - 1 = 5
第二个sint32元素,原始值为5,根据公式zigzag编码值 = |5| * 2 = 10
第三个int32元素,原始值为5,这里还是5