【Mysql】group语句删除重复数据只保留一条

news2026/3/25 2:07:31

【Mysql】group语句删除重复数据只保留一条

【一】案例分析

假如在数据初始化的时候，insert脚本执行了两次，导致表里的数据都是重复的（没有设置唯一键）。这个时候再加上mybatis-plus的selectOne方法，就会出现报错。因为selectOne方法要求查询结果必须唯一，如果出现多条数据就会报错。

所以需求就是，根据某个条件字段查询出所有这个字段存在重复的数据，然后删除掉重复的数据，保证条件查询的时候只能查出来1条数据。

以这张表为例：

CREATE TABLE `test`  (
  `id` varchar(32) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL COMMENT '注解id',
  `name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL COMMENT '名字',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Compact;

INSERT INTO test (id,`name`) VALUES (replace(uuid(),'-',''),'张三'),(replace(uuid(),'-',''),'张三');

表里有两条数据，然后名字是相同的，但是id是不同的，现在要求是只留一条数据：
在这里插入图片描述

【二】步骤一：查询name值重复的数据
现实开发当中可能一个字段无法锁定重复值，可以采取group by多个值！利用多个值来锁定重复的行数据！

SELECT
	name 
FROM
	test 
GROUP BY
	` name ` 
HAVING
	count( name ) > 1

【三】步骤二：查询重复数据里面每个最小的id

SELECT
	min( id ) AS id 
FROM
	test 
GROUP BY
	` name ` 
HAVING
	count( name ) > 1

【四】步骤三：查询去掉重复数据最小id的其他数据，也就是要删除的数据！

SELECT
	* 
FROM
	test 
WHERE
	name IN ( SELECT name FROM test GROUP BY ` name ` HAVING count( name ) > 1 ) 
	AND id NOT IN (
	SELECT
		min( id ) 
	FROM
		test 
	GROUP BY
		` name ` 
HAVING
	count( NAME ) > 1)

【五】步骤四：删除去掉重复数据最小id的其他数据
有了查询，直接改成delete不就可以了，真的是这样吗？其实不是的，如下运行报错：
在这里插入图片描述
首先明确一点这个错误只会发生在delete语句或者update语句，拿update来举例 : update A表 set A列 = (select B列 from A表)；这种写法就会报这个错误，原因：你又要修改A表，然后又要从A表查数据，而且还是同层级。Mysql就会认为是语法错误！

嵌套一层就可以解决，update A表 set A列 = (select a.B列 from (select * from A表) a); 当然这个只是个示例，这个示例也存在一定的问题，比如(select a.B列 from (select * from A表) a)他会查出来多条，然后赋值的时候会报 1242 - Subquery returns more than 1 row。

嵌套一层他就可以和update撇清关系，会优先查括号里面的内容，查询结果出来过后会给存起来，类似临时表，可能有的人该好奇了，update A表 set A列 = (select B列 from A表)；我明明加括号了呀，难道不算嵌套吗，当然不算，那个括号根本没有解决他们之间的层次关系！

【六】正确的写法
首先，先把表备份好，删错了也还能快速恢复。直接拷贝的一个新的表，改名字就行

（1）方式一

DELETE FROM test 
WHERE 
name IN ( select a.name from (SELECT name FROM test GROUP BY `name` HAVING count( name ) > 1) a) 
AND 
id NOT IN (select a.id from (SELECT  min(id) as id FROM test GROUP BY `name` HAVING count( name ) > 1) a)

注意：删除之前一定要先查询，然后再删除，否则一旦语法有问题导致删了不想删除的数据，想要恢复很麻烦！或者删除前备份好数据，不要嫌麻烦，一旦出问题，才是真正的大麻烦！

（2）方法二

DELETE FROM test 
WHERE
	id NOT IN (
	SELECT
		t.id 
FROM
	( SELECT MIN(id) as id FROM test GROUP BY NAME ) t)

【七】错误的写法
千万千万不能这么搞，下面这个语法相当于是先按name分组，然后查出来大于1的，这时候假如大于1的有很多，然后外面嵌套的那一层，只取了最小的一条数据，然后再加上使用的是NOT IN，最终会导致数据全部被删除！！！

在这里插入图片描述

执行前有四条数据，实际上我们要的是张三留下来一条，然后李四留下来一条

在这里插入图片描述
执行结果：只留下了一条！

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/819715.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【Mysql】group语句删除重复数据只保留一条

【Mysql】group语句删除重复数据只保留一条

相关文章

Java阻塞队列

高并发编程-2. 并发级别

PCIE上位机用什么工具?

2023年最新前端学习路线【超详细版】

流控平台Sentinel搭建和接入教程

组件（lvs,keeplive,orm,mysql，分布式事务）

解决ComposerStaticInit类重复加载问题

java判断字符串是否和空字符串（““）相等、是否和空引用（null）相等，比较顺序不同导致出现死代码（Dead code）

【Rust 日报】2023-07-30 Lemmy v0.18.3发布

数字化转型才是王道！零售行业的关键五大指标都在这里了，快收藏

RabbitMQ 教程 | 第4章 RabbitMQ 进阶

Navicat for Mysql8.xx 字段注释中文乱码解决方

10分钟掌握seaborn绘制多子图

ELK高级搜索（一）

详解AMQP协议以及JAVA体系中的AMQP

Vector - CAPL - 诊断模块函数（设置和获取）

电子技术的发展

【Java】快速入门JVM

我的会议（我的审批，会议签字附源码）

投稿注意！APA格式超全示例详解，原本28天能录用，可能要拖延2个月