既然是证明就要做到有图有真相。
证明途径1:系统概览法
查看达梦数据库“管理工具”->“对象导航”->“管理服务器”-“系统概览”->“字符集编码”->”GB18030”.
看见”GB18030”字样就是证据之一。如果你没有看见这个字样,而是UTF8等其他字样,请重新安装产品吧,安装向导时记得选择“GB18030”,再继续安装。
证明途径2:函数查询法
查看达梦数据库的手册->“DM8_SQL手册”->附录3“系统存储过程和函数”->“系统信息管理”->“9) SF_GET_UNICODE_FLAG/UNICODE ”
我们来执行一下试试,看这个系统函数返回多少呢?
看见”0”字样就是证据之一。如果你没有看见这个“0”结果值,而是1、2等其他数值,请重新安装产品吧,安装向导时记得选择“GB18030”,再继续安装。
证明途径3:国标对照测试法
有人说,上面只能证明支持GB18030,但是不知支持的时GB18030的2000版(第一版)、2005版(第二版)还是2022版(第三版),所以无法证明支持GB18030-2022?毕竟GB18030-2022共定义了8万多汉字,比2005版汉字多得多,不能证明其支持。
我下面拿国标来做个测试:
打开2022年8月发布的GB18030-2022《信息技术 中文编码字符集》文件,查看到关于汉字及汉字部首部分主要增加的部分集中在d)、e)、f)、g)、h)、i),共6个部分,这6个部分涉及的字符数量太多,有17886个,我们每个部分只做首尾的手工测试,全量测试则主要用脚本测。
手工测试方法:
select '0x82358F33' GB18030_code,bintochar('0x82358F33') GB18030_SYMBOLS union all select '0x82359636' GB18030_code,bintochar('0x82359636') GB18030_SYMBOLS union all select '0x9835F738' GB18030_code,bintochar('0x9835F738') GB18030_SYMBOLS union all select '0x98399E36' GB18030_code,bintochar('0x98399E36') GB18030_SYMBOLS union all select '0x98399F38' GB18030_code,bintochar('0x98399F38') GB18030_SYMBOLS union all select '0x9839B539' GB18030_code,bintochar('0x9839B539') GB18030_SYMBOLS |
select '0x9839B632' GB18030_code,bintochar('0x9839B632') GB18030_SYMBOLS union all select '0x9933FE33' GB18030_code,bintochar('0x9933FE33') GB18030_SYMBOLS union all select '0x99348138' GB18030_code,bintochar('0x99348138') GB18030_SYMBOLS union all select '0x9939F730' GB18030_code,bintochar('0x9939F730') GB18030_SYMBOLS union all select '0x81398B32' GB18030_code,bintochar('0x81398B32') GB18030_SYMBOLS union all select '0x8139A035' GB18030_code,bintochar('0x8139A035') GB18030_SYMBOLS; |
我们找到这些编码对应的页,查看其字形是否显示正确。
我们在国标GB18030-2022的page160页,找到了编码为“82358F33”的汉字字形,确实是“一个火加上一个常”,和标准上显示的汉字字形一样。
其他的字形相符性的证据,我就不一一截图供大家对比,大家去700多页的新版国标里找吧。
最新版国标新增的6个部分,通过上述验证,每个部分抽了2个字符进行测试,编码和字形是完全符合最新版国标要求的。达梦公司已通过脚本方式将1.7万个新增字符全部进行测试。
鉴于篇幅缘故,故不再此展示,有兴趣的同学可以自己动手试试。
证明途径4:权威机构的认证证书法
达梦数据库在4-5月份将产品送测到CESI机构进行检查,检测机构会将GB18030-2022上87887个汉字全部测试一遍。估计今年(2023年)的9-10月份就会拿到国标GB18030-2022的认证证书,到时候可以拿认证证书进行最权威的证明,大家敬请期待。
达梦数据库如何正确配置使之支持GB18030-2022信息技术中文编码字符集,请看下个博客。
达梦数据库打开GB18030-2022编码的SQL文件时有乱码怎么处理,请看下个博客。