MySQL将数据库所有表格和列编码格式从utf8mb3换成utf8mb4

news2024/9/23 17:19:35

最近在做数据导入,发现客户数据很多都带特殊符号,然后数据库就会提示 “java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x8C\xB8\xEF\xBC…’ for column ‘name’ at row 1”,看了一下数据库对应字段字符集是 utf8mb3 的,换成 utf8mb4 就好了,但是查看了一下其它表格,发现所有字段都是 utf8mb3 格式的,一个个的替换显然不现实。

直接上SQL (注意“sakura_task”换成自己的数据库名称)
首先我们可以把数据库字符集调整成 utf8mb4 (特别注意:生产环境谨慎操作,修改字符集会导致锁表!!!

ALTER DATABASE sakura_task CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;

接着我们把所有表的字符集也调整成 utf8mb4

SELECT CONCAT('ALTER TABLE ', TABLE_NAME, ' CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;')
FROM INFORMATION_SCHEMA.TABLES 
WHERE TABLE_SCHEMA = 'sakura_task' 
AND TABLE_TYPE = 'BASE TABLE';

注意上面那个是个查询语句,是为了生成我们需要修改的表的 SQL 语句,执行后是下面这样的

在这里插入图片描述

我们 Ctrl A 全部复制出来放到上面执行一下 (特别注意:生产环境谨慎操作,修改字符集会导致锁表!!!

在这里插入图片描述

最后我们把表格里面所有列的字符集也调整为 utf8mb4

SELECT CONCAT('ALTER TABLE ', TABLE_NAME, ' MODIFY ', COLUMN_NAME, ' ', COLUMN_TYPE, ' CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;')
FROM INFORMATION_SCHEMA.COLUMNS 
WHERE TABLE_SCHEMA = 'sakura_task' 
AND COLLATION_NAME LIKE 'utf8%';

同样的这里也是一个查询 SQL,我们还需要把查询结果复制出来执行

在这里插入图片描述

我们 Ctrl A 全部复制出来放到上面执行一下 (特别注意:生产环境谨慎操作,修改字符集会导致锁表!!!

在这里插入图片描述

执行完后我们还可以检查一下是不是所有表都调整好了

SELECT TABLE_NAME, COLUMN_NAME, CHARACTER_SET_NAME, COLLATION_NAME
FROM INFORMATION_SCHEMA.COLUMNS 
WHERE TABLE_SCHEMA = 'sakura_task'
AND CHARACTER_SET_NAME != 'utf8mb4';

返回空的就是所有的都调整了

在这里插入图片描述
下面再来看下 utf8mb4 和 utf8mb3 的区别

utf8mb4 和 utf8mb3 都是 MySQL 中的字符集,主要用于存储 UTF-8 编码的文本数据。它们之间的主要区别在于支持的字符范围和编码方式:

  1. 字符集支持的范围
    utf8mb3:是 MySQL 的早期版本中所使用的 UTF-8 实现。utf8mb3 实际上只支持最多 3 个字节的 UTF-8 编码字符,这意味着它只能表示基本多语言平面(Basic Multilingual Plane,BMP)中的字符,这些字符的 Unicode 编码范围是 U+0000 至 U+FFFF。
    utf8mb4:utf8mb4 是 MySQL 后来引入的 UTF-8 实现,支持 4 个字节的 UTF-8 编码字符。utf8mb4 不仅支持 BMP 中的字符,还能表示补充平面(Supplementary Planes)中的字符,这些字符的 Unicode 编码范围是 U+010000 至 U+10FFFF。

  2. 字符集支持的字符
    utf8mb3:不支持某些特殊字符,比如 Emoji 表情、部分罕见的汉字和历史字符,因为这些字符的 Unicode 编码超出了 3 个字节的范围。
    utf8mb4:支持所有 Unicode 字符,包括 Emoji 表情、一些罕见的汉字、历史文字符号等。

  3. 存储需求
    utf8mb3:因为每个字符最多使用 3 个字节,所以它的存储空间相对较小,但它不能存储所有的 Unicode 字符。
    utf8mb4:每个字符最多使用 4 个字节来存储,虽然存储需求增加,但能支持更广泛的字符集。

  4. 兼容性
    utf8mb4 向后兼容 utf8mb3,即已经在 utf8mb3 中存储的内容可以无缝转移到 utf8mb4 中,并且不会丢失数据。

  5. 推荐使用
    由于现代应用程序越来越多地使用 Emoji 和其他特殊字符,因此推荐使用 utf8mb4 作为 MySQL 数据库的字符集。这样可以确保兼容性和全面的字符支持。

总结来说,utf8mb4 是 utf8mb3 的扩展,能够支持更多字符,包括 Emoji 等常见字符,因此在新开发的系统中通常推荐使用 utf8mb4。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2090523.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

<Python><AI>基于智谱AI免费大模型GLM-4-Flash的智能聊天程序

前言 智谱AI开放了一个免费使用的大模型GLM-4-Flash,官方也提供了python的示例程序,我们结合pyqt5来编写一个基于GLM-4的简单的智能聊天工具。 界面大致如下: 环境配置 系统:windows 平台:visual studio code 语言&a…

Fedora koji构建系统详细教程之二 -- 构建

写在前面 本篇文章是上一篇文章的继续,由于koji里面的内容实在是太多,都塞进一篇文章里会显得很臃肿,于是我就拆成了两部分。在上一篇文章里,我们已经部署好了Fedora koji系统,此时kojihub已经运行、可以通过kojiweb或…

LavaDome:一款基于ShadowDOM的DOM树安全隔离与封装工具

关于LavaDome LavaDome是一款针对HTML代码安全和Web安全的强大工具,该工具基于ShadowDOM实现其功能,可以帮助广大研究人员实现安全的DOM节点/树隔离和封装。 在当今的Web标准下,尚无既定方法可以安全地选择性地隔离DOM子树。换句话说&#x…

这是不一样的svg图像优化哦。-可优化也可转换为组件

田间的风吹老了岁月,老舍笔下的茶馆写的是近代史,真的写尽了当时的苦态,可能现在的地铁写的是现代史吧。时光飞逝,很快就工作两三年了。昨天做项目的时候,引入svg图像转换为组件的时候,觉得很麻烦&#xff…

2.2 语言处理程序基础

以编译方式翻译C/C源程序的过程中,类型检查在( )阶段处理。 A. 词法分析 B. 语义分析 C. 语法分析 D. 目标代码生成 正确答案是 B。 解析 本题考查的是编译器工作过程。 A选项词法分析阶段处理的错误:非法字符、单词拼写错误等。与…

《王者荣耀》游戏玩法与部分机制分析

目录 游戏机制 MOBA核心玩法 匹配机制 游戏模式 隐藏分机制 游戏规则 总结 王者荣耀的ELO匹配机制是如何具体工作的? 王者荣耀中隐藏分机制的详细规则是什么?(难绷!) 王者荣耀边境突围和五军对决模式的具体玩…

解释:有序树是什么意思?

目录 有序树的特性: 例子: 总结 🌟 嗨,我是命运之光! 🌍 2024,每日百字,记录时光,感谢有你一路同行。 🚀 携手启航,探索未知,激发…

STM32基于HAL库使用串口+DMA 不定长接收数据 学习记录

我这些博客都只是记录一下自己学习的内容,以及记录一些思考过的问题和疑惑的东西 这里的代码借鉴了一位博主的博客 地址:[] 这里cubemx串口基础配置部分参考这一篇博客 (只配置了串口中断接收和printf重定向) 这一篇博客我们需要开…

C++编程:理解左值(lvalue)和右值(rvalue)

C 值的分类(Value Categories) 目录 1 概述 2 主要分类 1.1 左值(lvalue) 1.1.1 左值详情 1.1.2 左值属性 1.2 纯右值(prvalue) 1.2.1 纯右值详情 1.2.2 纯右值属性 1.3 将逝值(xvalue) 1.3.1 将逝值详情 1.3.2 将逝值属性 3 混合分类 3.1 泛型左值…

Day51 | 117. 软件构建(拓扑排序)47. 参加科学大会 dijkstra(朴素版)

语言 117. 软件构建 117. 软件构建 题目 题目描述 某个大型软件项目的构建系统拥有 N 个文件,文件编号从 0 到 N - 1,在这些文件中,某些文件依赖于其他文件的内容,这意味着如果文件 A 依赖于文件 B,则必须在处理…

【STM32】通用定时器TIM(时钟源选择与更新中断)

本篇博客重点在于标准库函数的理解与使用,搭建一个框架便于快速开发 目录 通用定时器简介 定时器时钟使能 选择时基单元时钟源 内部时钟源 外部时钟源 时基单元初始化 更新中断使能 定时器使能 定时器中断代码 Timer.h Timer.c 获取计数值 TIM(Time…

【王树森】RNN模型与NLP应用(7/9):机器翻译与Seq2Seq模型(个人向笔记)

Machine Translation Data 做机器学习任务的第一步都是处理数据,我们首先需要准备机器翻译的数据。由于我们是学习用途,因此拿一个小规模数据集即可:http://www.manythings.org/anki/下面的数据集中:一个英语句子对应多个德语句子…

Spring MVC执行流程

整体流程: 用户向前端控制器发送请求前端控制器接收到请求后调用处理映射器处理器映射器找到具体的处理器,生成处理器对象以及处理器拦截器,再一起返回给前端控制器然后前端控制器调用处理器适配器处理器适配器调用具体的处理器处理器适配器…

element plus el-upload上传组件,自动上传,记录解决:本地报404,文件找不到问题

问题&#xff1a; 解决问题&#xff1a; 重点是&#xff1a;加入action"#"和:http-request"uploadHttpRequest" <el-uploadv-loading"isLoading"ref"upload"v-model"fileList":multiple"multiple"action&quo…

《PCI Express体系结构导读》随记 —— 第II篇 第7章 PCIe总线的数据链路层与物理层(1)

前言中曾提到&#xff1a;本章重点介绍PCI Express总线的数据链路层与物理层。 PCIe总线的数据链路层处于事务层和物理层之间&#xff0c;主要功能是保证来自事务层的TLP在PCIe链路中的正确传递&#xff0c;为此数据链路层定义了一系列数据链路层报文&#xff0c;即DLLP。数据链…

AI实践与学习8-AI Agent Workflow助力解题和验证答案置信度

背景 之前在试着提高解题正确率&#xff0c;目标100%&#xff0c;发现外部知识不足仅依靠大模型的话比较困难。而试题人工生产成本巨大。 本质因为大模型生成内容会有幻觉特点&#xff0c;也就是说解答的试题正确性不太好评判&#xff0c;直接解答试题生产场景不太可控。 后…

市场纷乱中,沃尔沃坚守长期主义之道,用“P1+P4”解决用户痛点3A品质,插混王者——沃尔沃插混让性能成为插混必要条件

“造车就像西天取经&#xff0c;明确的方向、实现目标的能力&#xff0c;内心的坚持缺一不可”,本届成都国际车展上&#xff0c;来自沃尔沃汽车集团全球高级副总裁袁小林的一句话可谓是振聋发聩&#xff0c;向沉迷玩转“流量密码”的车企&#xff0c;向因各种噱头而迷茫的用户发…

RISC-V全志D1sCVBS套件

此开发板的任何问题都可以在我们的论坛交流讨论 https://forums.100ask.net/c/10-category/75-category/75 硬件简述 D1s主板 主板如下&#xff1a; D1s板载功能 板载功能有 XR829 WIFI蓝牙模组芯片&#xff0c;Bluetooth支持标准蓝牙与 低功耗蓝牙&#xff0c;Wifi 支持…

论被动元数据的弊端,以及主动元数据的技术优势

元数据是企业数据生态系统中不可或缺的组成部分&#xff0c;核心在于为数据本身提供完整的描述性信息&#xff0c;包括数据来源、数据结构、语义含义、物理位置、所有权归属、创建时间、流转路径等关键要素&#xff0c;是企业理解、开发、消费和应用数据的基石。 元数据管理&a…

毕设创新点之一:基于GD32/STM32的AI模型部署-github库

将AI模型成功部署到边缘MCU中&#xff0c;常常受限于MCU的计算峰值和内存峰值的限制&#xff0c;部署较为困难&#xff0c;目前有一个将AI算法MCU部署到GD32系列MCU中的宝藏的开源库。 项目网址&#xff1a;HomiKetalys/gd32ai-modelzoo: Provide deployable deep learning mo…