mysql字符串等值查询中条件字段值末尾有空格也能查到数据问题

news2025/1/12 13:09:47

一、事故还原

我们仍然使用学生信息表,但是我们只需要保留两个字段即可:
CREATE TABLE `student_info` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '学号',
  `name` varchar(20) CHARACTER SET utf8 DEFAULT NULL COMMENT '姓名',  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='学生基本信息表';
先插入三条数据备用:
#尾部无空格
INSERT INTO `student_info` (`name`) VALUES ('duduu');
#尾部带一个空格
INSERT INTO `student_info` (`name`) VALUES ('duduu ');
#尾部带两个空格
INSERT INTO `student_info` (`name`) VALUES ('duduu  ');

需要注意的是,name字段值分别是:不带空格的duduu、带一个空格的duduu、带两个空格的duduu,且空格都是加在了尾部。我们查询这几条记录的name字段的长度:

mysql> select length(name) from student_info;
+--------------+
| length(name) |
+--------------+
|            5 |
|            6 |
|            7 |
+--------------+
3 rows in set (0.00 sec)

这个结果是符合预期的,MySQL检索CHAR类型的数据时,CHAR类型的字段会去除尾部的空格;检索VARCHAR类型的字段数据时,会保留数据尾部的空格,因此这里的长度分别是5、6、7。我们针对name做简单的等值查询试试:

#不带空格的duduu
mysql> select * from student_info where name='duduu';
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 | duduu   |
|  3 | duduu   |
+----+---------+
3 rows in set (0.00 sec)

#带一个空格
mysql> select * from student_info where name='duduu ';
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 | duduu   |
|  3 | duduu   |
+----+---------+
3 rows in set (0.00 sec)

#带两个空格
mysql> select * from student_info where name='duduu  ';
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 | duduu   |
|  3 | duduu   |
+----+---------+
3 rows in set (0.00 sec)

我们会发现,无论后面带多少空格,我们始终可以把所有的用户信息都查询出来,这个并不符合我们的预期啊!!!如果我们将空格都放在最前面呢?会发生什么事情?我们来试试。删除表数据后,重新插入数据:

#前面无空格
INSERT INTO `student_info` (`name`) VALUES ('duduu');
#前面带一个空格
INSERT INTO `student_info` (`name`) VALUES (' duduu');
#前面带两个空格
INSERT INTO `student_info` (`name`) VALUES ('  duduu');
此时分别计算字段字符长度:
mysql> select * from student_info; 
+----+---------+
| id | name    |
+----+---------+
|  1 | duduu   |
|  2 |  duduu  |
|  3 |   duduu |
+----+---------+
3 rows in set (0.00 sec)

mysql> select length(name) from student_info;
+--------------+
| length(name) |
+--------------+
|            5 |
|            6 |
|            7 |
+--------------+
3 rows in set (0.00 sec)
可以看到空格放在前面和放在后面的查询结果是不一样的,这个倒不是我们关注的重点,我们关注等值查询是否可以正常查询出来:
#不带空格的duduu
mysql> select * from student_info where name='duduu';
+----+-------+
| id | name  |
+----+-------+
|  1 | duduu |
+----+-------+
1 row in set (0.00 sec)

#带一个空格
mysql> select * from student_info where name=' duduu';
+----+--------+
| id | name   |
+----+--------+
|  2 |  duduu |
+----+--------+
1 row in set (0.00 sec)

#带两个空格
mysql> select * from student_info where name='  duduu';
+----+---------+
| id | name    |
+----+---------+
|  3 |   duduu |
+----+---------+
1 row in set (0.00 sec)
通过实验发现,当空格放在前面时,等值查询是没有问题的,但是空格放在后面时,等值查询并不符合我们的预期。

二、合理推测

通过上面的实验,明明是三个长度不同的字符串,空格放在前边被认为是不同,放在后边又被认为是相同,难道说:对于MySQL来说,字符串做字符串等值判断时会忽略后面的空格,duduu(不带空格)、duduu(后面带一个空格)、duduu(后面带两个空格),都被认作是不带空格的duduu了吗?既然MySQL认为这三个字符串是一个,那么我们看看给name增加唯一索引时,插入这几条数据会不会报错。我们索性重新准备学生信息表:
CREATE TABLE `student_info` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '学号',
  `name` varchar(20) CHARACTER SET utf8 DEFAULT NULL COMMENT '姓名',
  UNIQUE KEY uk_name (name),
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='学生基本信息表';
此时插入数据:
mysql> #尾部无空格
mysql> INSERT INTO `student_info` (`name`) VALUES ('duduu');
Query OK, 1 row affected (0.00 sec)

mysql> #尾部带一个空格
mysql> INSERT INTO `student_info` (`name`) VALUES ('duduu ');
ERROR 1062 (23000): Duplicate entry 'duduu ' for key 'uk_name'
mysql> #尾部带两个空格
mysql> INSERT INTO `student_info` (`name`) VALUES ('duduu  ');
ERROR 1062 (23000): Duplicate entry 'duduu  ' for key 'uk_name'
不出所料,进行字符串等值判断时,MySQl认为duduu(不带空格)、duduu(后面带一个空格)、duduu(后面带两个空格)是重复的三个字符串,后面两条数据由于违背了唯一性,因而不可以被插入,我们去官方文档看看有没有提及这一点。

三、权威文档

官方文档链接:https://dev.mysql.com/doc/refman/5.7/en/char.html有提到这样的描述:

MySQL的校对规则基于PAD SPACE,这就意味着CHAR、VARCHAR、TEXT等字符串的等值比较(“=”)会忽略掉尾部的空格。但是这个规则不包括LIKE这样的模糊查询语句。图中代码示例说明的是使用=这样的等值查询时会自动忽略后面的空格,'Jones'和'Jones '都可以被查询到,但是Like需要精准匹配上空格才行。

四、解决思路

既然=查询会自动忽略后面的空格,如何解决呢?下面有两个思路。

🧷思路一:LIKE

如上所提到,官方文档给出了一个思路,即使用like。LIKE是基于逐个字符进行比较的,这样就不会忽略尾部的空格,官方文档有所提及:https://dev.mysql.com/doc/refman/5.7/en/string-comparison-functions.html

我们来实验下:

#不带空格的duduu
mysql> select * from student_info where name like 'duduu';
+----+-------+
| id | name  |
+----+-------+
|  1 | duduu |
+----+-------+
1 row in set (0.00 sec)

#带一个空格
mysql> select * from student_info where name like 'duduu ';
+----+--------+
| id | name   |
+----+--------+
|  2 | duduu  |
+----+--------+
1 row in set (0.00 sec)

#带两个空格
mysql> select * from student_info where name like 'duduu  ';
+----+---------+
| id | name    |
+----+---------+
|  3 | duduu   |
+----+---------+
1 row in set (0.00 sec)
这里可以得到两个结论:
  • LIKE后面的字段可以不带通配符;
  • LIKE是基于逐个字符进行比较的,这样就不会忽略尾部的空格

🧷思路二:BINARY

BINARY不是函数,是类型转换运算符,它用来强制它后面的字符串转为二进制字节,再逐个字节比较,也可以理解成精确匹配,官网上面有这样的描述:https://dev.mysql.com/doc/refman/5.7/en/cast-functions.html#operator_binary

可以看到,空格在BINARY转换后并不会被忽略,那么我们再使用BINARY进行等值查询进行验证:

#不带空格的duduu
mysql> select * from student_info where name = BINARY 'duduu';
+----+-------+
| id | name  |
+----+-------+
|  1 | duduu |
+----+-------+
1 row in set (0.00 sec)

#带一个空格
mysql> select * from student_info where name = BINARY 'duduu ';
+----+--------+
| id | name   |
+----+--------+
|  2 | duduu  |
+----+--------+
1 row in set (0.00 sec)

#带两个空格
mysql> select * from student_info where name = BINARY 'duduu  ';
+----+---------+
| id | name    |
+----+---------+
|  3 | duduu   |
+----+---------+
1 row in set (0.00 sec)

可见BINARY也可以解决此问题。

五、总结

本文的结论如下:

  • 在存储时,不会自动截断尾部的空格,会按原值存储;

  • MySQL的CHAR、VARCHAR、TEXT等字符串字段在等值比较("=")时,基于PAD SPACE校对规则,会忽略掉尾部的空格;

  • 如果想要精确查询就不能用等值查询("="),而应改用LIKE或BINARY;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/379659.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

挑战图像处理100问(26)——双线性插值

双线性插值是一种常用的图像插值方法,用于将低分辨率的图像放大到高分辨率。它基于一个假设:在两个相邻像素之间的值是线性的。 双线性插值考察444邻域的像素点,并根据距离设置权值。虽然计算量增大使得处理时间变长,但是可以有效…

电脑开机后进不了系统?原因以及解决方法

在日常使用电脑的过程中,我们有时候会遇到电脑开机后进不了系统的情况,这是令人十分烦恼的事情。那么,这种情况的出现可能是由于什么原因呢?接下来,本文将为您介绍电脑开机后无法进入系统的原因以及解决方法。 演示机型…

【Java】String类

1. String内部声明 jdk8以前: private final char value[]; final:指明数组一旦初始化,其地址就不能改变 jdk9以后: private final byte[] value;,为节省内存空间而优化 final:指明数组一旦初始化&…

这些让人变笨的食物你是不是天天吃?

我们关注食物的营养,关注它对身材、健康的影响。现在,我们发现有些食物,还会影响人的神经系统、认知能力。简而言之,就是有些食物可能会让人变笨。《美国医学会神经病学杂志》上的一项研究,分析了超加工食物与认知能力…

【蓝桥杯入门到入土】最基础的数组你真的掌握了吗?

文章目录一:数组理论基础二:数组知识点总结三:数组这种数据结构的优点和缺点是什么?四:实战解题1. 移除元素暴力解法双指针法2.有序数组的平方暴力解法双指针法最后说一句一:数组理论基础 首先要知道数组在…

【数据结构】堆的详解

本章的知识需要有树等相关的概念,如果你还不了解请先看这篇文章:初识二叉树 堆的详解一、二叉树的顺序结构及实现1、二叉树的顺序结构2、堆的概念及结构二、堆的简单实现 (以大堆为例)1、堆的定义2、堆的初始化3、堆的销毁4、堆的打印5、堆的插入6、堆顶元素的获取7…

网络传输:linux下的网络请求和下载(ping wget curl)、端口

一、下载和网络请求 1.ping命令 可以通过ping命令,检查指定的网络服务器是否可连通状态 语法:ping [-c num] ip或主机名 选项: -c 检查的次数,若不使用-c,将无限次数持续检查参数:ip或主机名&#xff0c…

基于Python的时间序列异常值检测

今天我们介绍一下使用python做时间序列数据分析和预测中异常值检测的方法,常用的异常值检测方法有以下几种: 3sigma: 基于正太分布,当数据值超过3个标准差(3sigma)时为异常值。z-score : z标准分数,它测量数据值到平均值的距离,当…

pandas对某一列的种类编码

文章目录背景实现背景 如果某一列的种类特别多,想要通过映射来编码,这样非常麻烦,所以可以对一个列全部一次性进行编码。 例如我的数据如下: 我需要编码专业这个列,我们可以看到这一列很多: 实现 使用…

【Unity】P3 基础设定

Unity基础设定父子关系InspectorTransformMesh FilterMesh Rendener第二种常用的父子操作Global 与 Local 模式Pivot 与 Center 模式声音组件创建多场景Asset 资源商店前言 上一篇博文主要围绕Unity的静态基础操作部分,从创建好的一个小方块cube开始,到对…

Selenium基于POM的自动化测试实践

什么是Page Object模式 Page Object 见名知意,就是页面对象,并将页面元素定位方法和元素操作进行分离。在实际自动化测试实战过程中,我们一般对脚本的实现分为三层: (1)对象层: 用于存放页面元素定位和控件操作 (2)逻…

《Nacos(3) - 集群搭建(详细)》

《Nacos(3) - 集群搭建》 提示: 本材料只做个人学习参考,不作为系统的学习流程,请注意识别!!! 《Nacos3 - 集群搭建》《Nacos(3) - 集群搭建》1.集群结构图2.搭建集群2.1.初始化数据库2.2.下载nacos2.3.配置Nacos2.4.启动2.5.nginx反向代理2.6.优化1.集群结构图 官方给出的Na…

【JavaSE】对象的比较

哈喽,大家好!我是保护小周ღ,本期为大家带来的是Java中自定义类型(对象)的三种比较方式,equals 方法, Comparable 泛型接口, Comparator 泛型接口 。在日常编程中,我们常常会需要比较的问题&…

cuda版本,pytorch(GPU)版本的选择和下载

cuda版本: 1.Nvidia控制面板里的cuda版本, 或使用nvidia-smi命令显示的cuda版本 是cuda的driver api版本 2.nvcc -V中的cuda版本,是cuda的runtime api版本,即cudatoolkit的版本 cudatoolkit的版本不能高于cuda driver api的版本&#xff…

23.2.28 Staffing System

员工管理系统功能介绍: 1)服务器负责管理所有员工表单(以数据库形式),其他客户端可通过网络连接服务器来查询员工表单。 2)需要账号密码登陆,其中需要区分管理员账号还是普通用户账号。 3&am…

聚观早报 | 苹果2024年放弃高通;腾讯回应进军类 ChatGPT

今日要闻:苹果2024年放弃高通;腾讯回应进军类 ChatGPT;小米发布无线AR眼镜探索版;50%的美国企业已在使用ChatGPT;Snap推出ChatGPT驱动的聊天机器人 苹果2024年放弃高通 高通公司 CEO 兼总裁克里斯蒂亚诺・安蒙&#xf…

Node.js 是个啥?

趣学 Node.js - 死月 - 掘金小册带你重新体悟 Node.js 之美。「趣学 Node.js」由死月撰写,1923人购买https://s.juejin.cn/ds/SYVvuDw/ 在这里,我们先装作对 Node.js 不了解,从头来过吧。你有没有假装不了解 Node.js 我不知道,但…

界面开发(2)--- 使用PyQt5制作用户登陆界面

使用PyQt5制作用户登陆界面 上篇文章已经介绍了如何配置PyQt5环境,这篇文章在此基础上展开,主要记录一下如何使用 PyQt5 制作用户登陆界面,并对一些基础操作进行介绍。 下面是具体步骤,一起来看看吧! 1. 打开 Pychar…

【IoT】2023裁员潮还在继续,构建规划能力也许是一剂良方

今天要分享的主题是华为的市场管理方法论。 市场管理这个词总体来说还是有些抽象,本质上来看或者说从个人的角度来看,其实就是一种规划的能力。 无论是创业,还是作为职场人,规划能力必将是你不可或缺的一种基础能力。 尤其是在这样…

Maven说明

目录 1.说明 2.详细说明 3.Maven模型 4.Maven常用的命令 5.Maven生命周期 6.Maven坐标 7.依赖管理与依赖范围 1.说明 Maven是专门用于管理和构建Java项目的工具,它是基于项目对象模型(POM)的概念,主要功能有: 提供了一套标准化的项目…