背景
flink有多种序列化方式,包括flink内置的以及fallback到kryo的,那么他们之间有多大的性能差距呢,本文就从https://flink.apache.org/2020/04/15/flink-serialization-tuning-vol.-1-choosing-your-serializer-if-you-can/这篇文章里摘录几个重要的结论
不同序列化方式的性能差异
结论1:flink自带的Tuple类的序列化性能最高,其中一部分原因来源于不需要使用反射来访问Tuple中的字段
结论2:Pojo序列化比Tuple序列化性能差一些,但是比kryo的序列化方式性能要高几倍
结论3:Pb或者Thrift经由Kryo注册后,其序列化性能并不差
以上的结论都可以使用SerializationFrameworkAllBenchmarks.java类进行验证
附:
flink性能基础测试
https://github.com/apache/flink-benchmarks