用 JS 解析 excel 文件需要分几步

news2024/11/24 10:47:19

八月长江万里晴,千帆一道带风轻。

大家好,我是嘿嘿,今天来聊一聊如何使用 JS 来解析 excel 文件,当然不是直接使用 exceljssheetjs 之类的库,那就没意思了,而是主要说一下 JS 解析 excel 表格是如何实现的。

注意本文主要讨论 xlsx 格式的 excel 表格,其它格式未探究并不清楚。

excel 表格文件到底是什么

首先要解析 excel 文件,得先了解他是如何存储数据的,经过我百般搜索,终于在 GG 中找到了答案:excel 文件其实是一个 zip 包!于是我赶紧新建了一个 xlsx 文件,在其中新建了两个 sheet 表,两个 sheet 表数据如下:

此为 sheet 1:

ABC
12
12
12
12

此为 sheet 2:

AB
qa
qa
qa

然后使用 zip 进行解压:

unzip test.xlsx -d test 

然后通过 tree 我们就拿到这样一个目录结构:

test
├── [Content_Types].xml
├── _rels
├── docProps
│ ├── app.xml
│ ├── core.xml
│ └── custom.xml
└── xl├── _rels│ └── workbook.xml.rels├── sharedStrings.xml├── styles.xml├── theme│ └── theme1.xml├── workbook.xml└── worksheets├── sheet1.xml└── sheet2.xml 

啊哈,干得漂亮,居然全都是 xml 文件。

我们在打开 xml 一探究竟,可以看出有几个文件很显眼,就是 worksheets 下的 sheet1.xmlsheet2.xml,还有 workbook.xml,其他的 stylestheme 一看就是和样式有关系,_rels 感觉就是什么内部引用,我们先看看两个 sheetxml 文件,看看猜测是否正确,贴下 sheet1.xml

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<worksheet xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main"xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships"xmlns:xdr="http://schemas.openxmlformats.org/drawingml/2006/spreadsheetDrawing"xmlns:x14="http://schemas.microsoft.com/office/spreadsheetml/2009/9/main"xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"xmlns:etc="http://www.wps.cn/officeDocument/2017/etCustomData"><sheetPr/><dimension ref="A1:C7"/><sheetViews><sheetView workbookViewId="0"><selection activeCell="D5" sqref="A3:D5"/></sheetView></sheetViews><sheetFormatPr defaultColWidth="9.23076923076923" defaultRowHeight="16.8" outlineLevelRow="6" outlineLevelCol="2"/><sheetData><row r="1" spans="1:3"><c r="A1"><v>1</v></c><c r="C1"><v>2</v></c></row><row r="2" spans="1:3"><c r="A2"><v>1</v></c><c r="C2"><v>2</v></c></row><row r="6" spans="1:3"><c r="A6"><v>1</v></c><c r="C6"><v>2</v></c></row><row r="7" spans="1:3"><c r="A7"><v>1</v></c><c r="C7"><v>2</v></c></row></sheetData><pageMargins left="0.75" right="0.75" top="1" bottom="1" header="0.5" footer="0.5"/><headerFooter/>
</worksheet> 

😂 相信大家已经看出来了,sheetData 就是 excel 表格中的数据了,<row> 代表行,其中的 r 则是行数索引,row 中的 <c> 应该是 cell 了,其中的 <v> 对应着 cell 中的值,而 r 则是 cell 的位置,如 A7 代表着在 A 列 7 行。

此外还有几个很明显的属性如 dimension 可以看出是表格的大小范围,从 A1 cellC7 cell 形成一个框。<sheetViews> 中存储的应该是页面中的信息,<selection> 代表的应该就是被选中的表格内容了。

workbook 中存储的则是 sheet 的信息:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<workbook xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main"xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships"><fileVersion appName="xl" lastEdited="3" lowestEdited="5" rupBuild="9302"/><workbookPr/><bookViews><workbookView windowHeight="16360" activeTab="1"/></bookViews><sheets><sheet name="Sheet1" sheetId="1" r:id="rId1"/><sheet name="Sheet2" sheetId="2" r:id="rId2"/></sheets><calcPr calcId="144525"/>
</workbook> 

剩下的几个 xml,大概看了一眼,存储的信息还算很清楚,比如:

  • app 中存储了文件程序的信息,好像还有文件名
  • core 中保存了作者的信息和创建、修改时间
  • rels 文件也是 xml 格式,存储了一些其它 xml 的引用
  • theme 里存储了表格中定义的颜色、字体
  • [Content_Types] 里则是所有文件的引用,猜测估计为解析的入口文件

JS 实现步骤

知道了 excel 文件是如何存储数据的,那我们如何用 js 来解析它就很清楚了,主要分三步:

1.使用 js 解压缩 excel 文件
2.获取到其中的 sheet 文件内容,然后将 xml 数据解析出来
3.将数据转换成我们想要的形状

说干就干,那我们来实操一下:

ZIP 解压

关于 JS 如何实现 ZIP 解压的,上一篇文章也有提到,这里我们就不细说,直接使用 jszip 搞定:

document.querySelector('#file').addEventListener('change', async e => {const file = e.target.files[0];if (!file) return;const zip = await JSZip.loadAsync(file);const sheetXML = await zip.files['xl/worksheets/sheet1.xml'].async('string');
}); 

快速搞定,现在 sheetXML 就是我们刚刚看到的 sheet1.xml 中的数据了。

XML 解析

然后我们即可解析 XML 内容将其中数据取出,xml 解析原理很简单,和 html parse 一样,了解原理咱就直接随便搞个开源库帮忙搞定:

import convert from 'xml-js';

const result = convert.xml2json(sheetXML, { compact: true, spaces: 4 }); 

然后我们就得到了这样一串 JSON(删除了部分内容):

{"_declaration": {"_attributes": {}},"worksheet": {"_attributes": {},"sheetPr": {},"dimension": {"_attributes": {"ref": "A1:C7"}},"sheetData": {"row": [{"_attributes": {"r": "1","spans": "1:3"},"c": [{"_attributes": {"r": "A1"},"v": {"_text": "1"}},{"_attributes": {"r": "C1"},"v": {"_text": "2"}}]},{"_attributes": {"r": "7","spans": "1:3"},"c": [{"_attributes": {"r": "A7"},"v": {"_text": "1"}},{"_attributes": {"r": "C7"},"v": {"_text": "2"}}]}]}}
} 

接下来,我们只需要将 sheetData 中的数据取出,然后按照内部的属性生成自己想要的数据格式即可。

总结

excel 文件本质就是一个 zip 包,我们只需要通过 zip 解压、xml 解析、数据处理这三个步骤,即可使用 JS 读取到其中的数据,当然其中的细节还是很多的,不过如果只是简单的 excel 模版,不妨自己尝试一下。

最后

为大家准备了一个前端资料包。包含54本,2.57G的前端相关电子书,《前端面试宝典(附答案和解析)》,难点、重点知识视频教程(全套)。



有需要的小伙伴,可以点击下方卡片领取,无偿分享

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/89623.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STM32F4 IAP 跳转 APP问题

1. 概念 IAP 的作用&#xff0c;网上其他资料已经有很多介绍了&#xff0c;这里放一个链接&#xff0c;不进行深入的介绍。本文的关注重点是Bootloader在跳转APP程序中出现的问题。 IAP的实现原理讲解以及中断向量表的偏移 2. 程序 本人主要做应用层的开发&#xff0c;所有Boo…

深蓝学院-多传感器融合定位课程-第7章-基于滤波的融合方法I

专栏文章: 深蓝学院-多传感器融合定位课程-第1章-概述_goldqiu的博客-CSDN博客 深蓝学院-多传感器融合定位课程-第2章-3D激光里程计I_goldqiu的博客-CSDN博客 深蓝学院-多传感器融合定位课程-第3章-3D激光里程计II_goldqiu的博客-CSDN博客 深蓝学院-多传感器融合定位课程-第…

自学100天,零基础转行软件测试,我要以更好的姿态奔赴下一场山海~

三年大专一场空 专业是电子商务&#xff0c;18年毕业&#xff0c;当时在报考时时觉得电子商务挺高大上的&#xff0c;觉得电商肯定会有前途&#xff0c;以后毕业肯定好找工作&#xff0c;跟大多数人一样&#xff0c;我开始幻想我以后毕业以后的纸醉金迷的生活&#xff0c;我以…

落地 DevOps,探索高效研发运营一体化解决方案

前言与概述 伴随着企业业务的快速发展&#xff0c;为了支撑业务发展&#xff0c;提高 IT 对业务的支撑能力建设。在研发工程协同方面&#xff0c;希望加强代码管理&#xff0c;实现持续构建、自动化测试、自动化部署、自动化运维&#xff0c;同时加强产品的安全和质量管理&…

华为路由器 静态路由

需求&#xff1a; 实现 PC1 与 PC2 互通 1、拓扑图 主机IP掩码网关PC1192.168.10.10255.255.255.0192.168.10.1PC2192.168.40.40255.255.255.0192.168.40.1PC3192.168.30.30255.255.255.0192.168.30.1 2、R1 路由器 <Huawei>undo ter mo Info: Current terminal monit…

c#调用c++捕获SEH异常

C代码&#xff1a; extern "C" __declspec(dllexport) int ExceptionTest() { int* pointer NULL;*pointer 100; return 100; }c#代码&#xff1a; class C_Sharp_Call_C__{[DllImport("testDll.dll", CallingConvention CallingConvention.Cdecl)]p…

SpringMVC:Spring与SpringMVC各自bean加载控制(2)

问题提出&#xff1a;学习Spring技术的时候在config目录下创建了一个配置类SpringConfig。现在学习SpringMVC技术在config目录下又创建一个SpringMvcConfig配置类。这两个配置类都需要加载资源&#xff0c;那么它们分别都需要加载哪些内容? 目录结构&#xff1a; config目录存…

[附源码]Python计算机毕业设计房屋租赁管理系统设计Django(程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等…

完全可用的迁移docker目录方案(centos/redhat)

完全可用的迁移docker目录方一、前提二、具体操作如下&#xff1a;2.1 先模拟运行一个 docker mysql2.2 先停docker进程2.3 新建存储目录2.4 修改启动默认的目录2.4.1 使用软链接(推荐)2.4.2 修改/etc/docker/daemon.json &#xff08;推荐&#xff09;2.4.3 指定容器启动参数&…

【深度学习】PyTorch深度学习实践 - Lecture_12_Basic_RNN

文章目录一、RNN介绍1.1 RNN为什么能处理有序数据&#xff1f;1.2 RNNCell内部剖析二、How to use RNNCell In PyTorch2.1 参数分析2.2 PyTorch代码实现三、How to use RNN In PyTorch3.1 参数分析3.2 NumLayers3.3 PyTorch代码实现3.4 其他参数四、Example1&#xff1a;Using …

fpga实操训练(锁相环pll)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 锁相环pll是fpga区别于stm32、soc很重要的一个特征。通常来说&#xff0c;输入的晶振一般是25m、50m这样的&#xff0c;不一定能满足功能的开发。这…

QT—QList与QLinkedList类的常用方法

QList<T>维护了一个指针数组&#xff0c;数组元素指向每一个链表项&#xff0c;因此QList<T> 提供了基于下标的快速访问。QLinkedList<T>是一个链式列表&#xff0c;不能使用下标访问&#xff0c;与QList相比&#xff0c;当对一个很大的列表进行插入操作时&a…

最近爆火chatGTP是人工智能还是人工智障?

关于chatGTP和一些话题? OpenAI 发布了 ChatGPT&#xff0c;是一个可以对话的方式进行交互的模型&#xff0c;因为它的智能化&#xff0c;得到了很多用户的欢迎。 ChatGPT是InstructGPT的兄弟模型&#xff0c;可以以对话的形式与用户交互&#xff0c;这使得ChatGPT能够回答问…

linux第五章---git的基本操作

git作为代码管理仓库&#xff08;版本管理工具&#xff09;&#xff0c;主要有GitHub和Gitee等等。&#xff0c;大家可以登录官网注册&#xff0c;Github经常访问不到&#xff08;看运气&#xff09;&#xff0c;Gitee作为国内比较火的一个平台(较商业化)。 1.git基本概念 工…

Java连接Access数据库改成MySQL连接数据库

升级诉求&#xff1a;Java连接Access已经算是过时的产物了&#xff0c;一般作为存储服务的应用在Java界比较常用的还是MySQL&#xff0c; 当然还有Oracle数据库。这里要讲的就是连接MySQL数据库了。 就是因为有了SQL标准&#xff0c;各大厂商实现SQL语句基本上大同小异&#xf…

基于Python完成CA系统的设计和实现(附源码)

CA 系统开发 一、CA系统的设计和实现 ​ 注&#xff1a;CA&#xff0c;Certificate Authority&#xff0c;电子认证服务或机构&#xff0c;为电子签名相关各方提供真实性和可靠性验证&#xff0c;是负责发放和管理数字证书的权威机构&#xff0c;并作为电子商务交易中受信任的…

基于Feign远程调用

RestTemplate方式调用存在的问题 先看看我们以前利用RestTemplate发起远程调用的代码&#xff1a; 存在下面的问题&#xff1a; 1、代码可读性差&#xff0c;编程体验不统一&#xff1b; 2、参数复杂URL难以维护&#xff1b; 为了解决这些问题&#xff0c;所以引入了Feign&am…

QT QStackedWidget 控件 使用详解

本文详细的介绍了QStackedWidget控件的各种操作&#xff0c;例如&#xff1a;新建界面、页面切换、添加页面、addWidget、count、currentIndex 、currentWidget、indexOf、insertWidget、removeWidget、widget、setCurrentIndex 槽函数、setCurrentWidget 槽函数、currentChang…

RSS Can:将网站信息流转换为 RSS 订阅源(三)

第三篇内容里&#xff0c;我们来聊聊把结构化数据转换为可以订阅的 RSS 订阅数据源。 写在前面 通过前两篇文章《RSS Can&#xff1a;使用 Golang 实现更好的 RSS Hub 服务&#xff08;一&#xff09;》和《RSS Can&#xff1a;借助 V8 让 Golang 应用具备动态化能力&#xf…

【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)

相比于一种计算框架一个集群的模式&#xff0c;共享集群的模式具有以下三个优点 1&#xff1a;硬件共享 资源利用率高 2&#xff1a;人员共享 运维成本低 3&#xff1a;数据共享 数据复制开销低 一、集群资源统一管理系统 集群资源统一管理系统需要支持多种计算框架,并需…