记录生僻字编码问题

记录生僻字编码问题

news2026/2/8 16:51:21

目录

- 生僻字消失?
- hexdump

生僻字消失?

前段时间遇到一个问题，对方系统确认推送的文件里客户姓名为3个字：倪明，中间字如下：
PS: 忽略上面的编码哈，只看汉字
在这里插入图片描述
且文件为UTF8格式，本系统接收后转码为GB18030后，在服务器上cat 命令查看此行数据，姓名如下图：中间看起来有个空格

倪   明|10|

hexdump

问题1：对方系统的UTF8文件是否有这个生僻字
查看十六进制内容：
在这里插入图片描述
倪明的UTF8编码：

对比可以看出：中间生僻字的编码为：\xee90a1
将UTF8编码转换为unicode 编码–U+e421，转换规则参考：

而unicode 这个区是属于私有区：
补充知识：主要私有区由U+E000到U+F8FF范围内的代码点组成，总共6400个私有字符。
编码结构。按照惯例，主要私有区被划分为平台编写器的公司级使用分区，从U+F8FF开始向下扩展，以及从U+E000开始向上扩展的最终用户分区。

问题2：转码后GB18030是否有这个生僻字
查看十六进制内容：
在这里插入图片描述
倪明的GB18030编码：

对比可知生僻字的GB18030 编码为\xfdb8
属于用户自定义区2 属于字库中不存在的字，所以终端没有显示

具体的GB18030 可以下载完整文件：
国家标准全文公开系统–GB18030编码表文件

疑问：

Q1. 图片中的码值为啥与实际文件中的值不一致呢
A1: 姓名生僻字处理平台—此网站写得挺明白的，生僻字会有正式码值与PUA码两种编码形式，而公安部是使用PUA编码，而图片中的码值却属于正式码。对于我的业务场景，此客户是需要过联网核查系统，故这里使用的是PUA码值。
在这里插入图片描述

参考链接：–宝藏网站
汉字字符集编码查询
姓名生僻字处理平台

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/956908.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

BMC相关知识

BMC相关知识

简介 BMC（Baseboard Management Controller），基板管理控制器，普通PC没有，服务器产品必备。BMC是一个独立的系统，只要通电即可运行，服务器无需开机，不依赖其它软硬件，如O…

阅读更多...

代价高昂的 IT 错误：识别并避免供应商锁定

代价高昂的 IT 错误：识别并避免供应商锁定

陷入不提供所需服务的云服务器合同中可能会非常痛苦、令人沮丧且成本高昂。供应商锁定是提供商难以切换的地方，这意味着企业迁移到新供应商的成本太高、破坏性太大或耗时。这使得公司受到供应商的摆布，尽管该服务可能无法提供他们所需的可靠性或可扩…

阅读更多...

解决“Windows Terminal软件报0xd000003a“问题

解决“Windows Terminal软件报0xd000003a“问题

在2019年5月，微软发布第一个版本的Microsoft Terminal软件，支持tab分页、Shell脚本、bat脚本等。Terminal比DOS更方便，命令也更丰富，支持UTF-8字体、主题样式定制、窗格、快捷方式等等。在win10上，打开Microsof…

阅读更多...

PSP - 蛋白质结构预测 OpenFold Multimer 重构训练模型的数据加载

PSP - 蛋白质结构预测 OpenFold Multimer 重构训练模型的数据加载

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132602155 OpenFold Multimer 在训练过程的数据加载时，需要将 MSA 与 Template 信息转换成 Feature，再进行训练&#xff0…

阅读更多...

【源码】智能导诊系统：医疗行业的变革者

【源码】智能导诊系统：医疗行业的变革者

智能导诊系统源码，3D人体导诊系统源码随着科技的迅速发展，人工智能已经逐渐渗透到我们生活的各个领域。在医疗行业中，智能导诊系统成为了一个备受关注的应用。本文将详细介绍智能导诊系统的概念、技术原理以及在医疗领域中的应用&#xff0c…

阅读更多...

计算机毕业设计之基于Python+MySQL的健身房管理系统（文档+源码+部署教程）

计算机毕业设计之基于Python+MySQL的健身房管理系统（文档+源码+部署教程）

系统主要采用python技术和MySQL数据库技术以及Django框架进行开发。系统主要包括个人中心、用户管理、教练管理、健身课程管理、健身器材管理、健身记录管理、身体数据管理、在线留言、系统管理、订单管理等功能，从而实现智能化的健身房管理方式，提高健身…

阅读更多...

DatenLord前沿技术分享No.34

DatenLord前沿技术分享No.34

达坦科技专注于打造新一代开源跨云存储平台DatenLord，通过软硬件深度融合的方式打通云云壁垒，致力于解决多云架构、多数据中心场景下异构存储、数据统一管理需求等问题，以满足不同行业客户对海量数据跨云、跨数据中心高性能访问的需求。在本周…

阅读更多...

Jenkins测试报告样式优化

Jenkins测试报告样式优化

方式一：修改Content Security Policy（临时解决，Jenkins重启后失效) 1、jenkins首页—>ManageJenkins—>Tools and Actions标题下—>Script Console 2、粘贴脚本输入框中：System.setProperty("hudson.model.Directo…

阅读更多...

Java中转换流(InputStreamReader,OutputStreamWriter),打印流(PrintStream,PrintWriter)

Java中转换流(InputStreamReader,OutputStreamWriter),打印流(PrintStream,PrintWriter)

转换流 InputStreamReader 和 OutputStreamWriter 是 Java 中用于字符流和字节流之间进行转换的转换流类。它们主要用于解决字符编码的问题，在字节流和字符流之间提供了桥梁，可以将字节流转换为字符流或将字符流转换为字节流。 InputStreamReader&#…

阅读更多...

提高Python并发性能 - asyncio/aiohttp介绍

提高Python并发性能 - asyncio/aiohttp介绍

在进行大规模数据采集时，如何提高Python爬虫的并发性能是一个关键问题。本文将向您介绍使用asyncio和aiohttp库实现异步网络请求的方法，并通过具体结果和结论展示它们对于优化爬虫效率所带来的效果。 1. 什么是异步编程？ 异步编程是一种非阻…

阅读更多...

实战教学：农产品小程序商城的搭建与运营

实战教学：农产品小程序商城的搭建与运营

随着移动设备的普及和互联网技术的发展，小程序商城已经成为农产品销售的一种新兴渠道。本文将以乔拓云网为平台，详细介绍如何搭建和运营农产品小程序商城。步骤一：登录乔拓云网后台首先，进入乔拓云网站后台，找到并点…

阅读更多...

Centos7 使用docker安装oracle数据库（超详细）

Centos7 使用docker安装oracle数据库（超详细）

在linux中采用解压安装包的方式安装oracle非常麻烦，并且稍微不注意就会出现问题，因此采用docker来安装，下面为详细的步骤： 若不知道是否安装docker可查看这篇文章：docker安装 1、拉取oracle镜像 docker pull registr…

阅读更多...

计算机网络 | TCP 三次握手四次挥手 |半关闭连接

计算机网络 | TCP 三次握手四次挥手 |半关闭连接

本来是不愿意写的，可是在实际场景，对具体的描述标志还是模糊不清，基础不扎实，就得承认！！！ TCP 连接建立需要解决三大问题： 知道双方存在约定一些参数，如最大滑动窗口值、…

阅读更多...

YOLOv5算法改进（10）— 替换主干网络之GhostNet

YOLOv5算法改进（10）— 替换主干网络之GhostNet

前言：Hello大家好，我是小哥谈。GhostNet是一种针对计算机视觉任务的深度神经网络架构，它于2020年由中国科学院大学的研究人员提出。GhostNet的设计目标是在保持高精度的同时，减少模型的计算和存储成本。GhostNet通过引入Ghost模块…

阅读更多...

浅谈多人游戏原理和简单实现。

浅谈多人游戏原理和简单实现。

😜作者：是江迪呀✒️本文关键词：websocket、网络、原理、多人游戏☀️每日一言：这世上有两种东西无法直视，一是太阳，二是人心！ 一、我的游戏史我最开始接触游戏要从一盘300游戏…

阅读更多...

RSA算法与错误敏感攻击

RSA算法与错误敏感攻击

参见《RSA 算法的错误敏感攻击研究与实践》 RSA 算法简介 RSA 算法原理： 1） RSA 算法密钥产生过程 （1）系统随机产生两个大素数 p p p 和 q q q，对这两个数据保密； （2）计算 n p …

阅读更多...

Java类的声明周期、对象的创建过程

Java类的声明周期、对象的创建过程

一、类的生命周期使用类时，要先使用类加载器将类的字节码从磁盘加载到内存的方法区中，用Class对象表示加载到内存中的类，Class类是JDK中提供的类创建对象时，是根据内存中的Class对象，在堆中分配内存，完成…

阅读更多...

c语言之指针的学习

c语言之指针的学习

1.指针是什么 （指针是内存中一个最小单元的编号,也就是地址） int main() {int a10;//当我们取出地址a的时候,取出的其实是a占4个字节中的第一个字节的地址int *pa&a;//pa是一个指针变量,用于存放地址//pa在口头语上常说为指针//指针本质上就是地址,…

阅读更多...

C++学习|CUFFT计算一维傅里叶变换

C++学习|CUFFT计算一维傅里叶变换

CUFFT计算一维傅里叶变换 CUFFT库介绍CUFFTW计算一维傅里叶变换CUFFT计算一维傅里叶变换前言：之前实现了CPU运行一维傅里叶变换，最近要改成GPU加速一维傅里叶变换，于是有了此篇作为记录，方便以后查阅。 CUFFT库介绍 CUFFT&#…

阅读更多...

Protein - ECD (ExtraCellular Domain) 膜蛋白胞外区的 UniProt 与 PDB 数据分析

Protein - ECD (ExtraCellular Domain) 膜蛋白胞外区的 UniProt 与 PDB 数据分析

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132597158 ECD 是 Extracellular Domain 的缩写，指的是跨膜蛋白质的细胞外部分 (膜蛋白的胞外区)，通常包含一些功能性的结…

阅读更多...

推荐文章

最新文章