当从不同来源导入Excel数据时,可能存在重复的记录。为了确保数据的准确性,通常需要删除这些重复的行。
手动查找并删除可能会非常耗费时间,而通过编程脚本则可以实现在短时间内处理大量数据。本文将提供一个使用C# 快速查找并删除Excel重复项的免费解决方案。
以下是实现步骤:
1. 首先安装免费.NET Excel 库 - Free Spire.XLS for .NET。( 可通过Nuget直接安装或者下载后手动安装)
2. 导入命名空间。
3. 使用LoadFromFile()方法加载Excel文件。
4. 获取指定工作表,并指定需要查找重复记录的单元格区域。
5. 使用LINQ 查询来找出重复行,并将这些行的行号存储在一个列表中。
6. 遍历这个列表并删除所有重复行。
7. 保存文件。
删除Excel重复行(C#代码)
using Spire.Xls;
using System.Linq;
namespace RemoveDuplicateRows
{
class Program
{
static void Main(string[] args)
{
//加载Excel文件
Workbook workbook = new Workbook();
workbook.LoadFromFile("示例.xlsx");
//获取第一张工作表
Worksheet sheet = workbook.Worksheets[0];
//指定需要删除重复记录的单元格区域
var range = sheet.Range["A1:A" + sheet.LastRow];
//获取重复项的行号
var duplicatedRows = range.Rows
.GroupBy(x => x.Columns[0].DisplayedText)
.Where(x => x.Count() > 1)
.SelectMany(x => x.Skip(1))
.Select(x => x.Columns[0].Row)
.ToList();
//删除重复行
for (int i = 0; i < duplicatedRows.Count; i++)
{
sheet.DeleteRow(duplicatedRows[i] - i);
}
//保存Excel文件
workbook.SaveToFile("删除重复行.xlsx");
}
}
}
以上代码快速查找了指定单元格范围内的重复项并实现一次性批量删除。效果如图:
Free Spire.XLS for .NET提供了一种操作Excel文档的高效方法,而无需依赖Microsoft Excel。这个库还支持读取、写入、转换、打印Excel等各种功能,可点击其中文教程查看更多示例。