灵魂拷问:读取 excel 测试数据真的慢吗?

news2025/1/18 20:16:13
  • 📢专注于分享软件测试干货内容,欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正!
  • 📢交流讨论:欢迎加入我们一起学习!
  • 📢资源分享:耗时200+小时精选的「软件测试」资料包
  • 📢 最困难的时候,也就是我们离成功不远的时候!

前言

在实现自动化测试的时候,我们经常会使用数据驱动。所以我们经常会把测试数据单独保存在一个特定格式的文件当中,然后通过读取文件去驱动自动化测试代码。

这篇文章会对比 Excel、CSV 和 YAML 三种主流的文件格式,看看它们哪个更好。

先来看用的最多的 Excel

Excel 是世界上使用最广泛的数据文件格式。使用 python 做自动化测试,可以用 openpyxl 这个第三方库操作 Excel。

经常有人说 Excel 的操作限制很多,写入和读取的速度很慢。真的是这样吗?

我们做个实验。创建一个空的 Excel 文件,然后插入 1000 条数据,看插入数据和读取这些数据会耗费多久的时间。


import openpyxl


def test_insert_1000_lines_data():
    lines = 1000
    workbook = openpyxl.Workbook()
    worksheet = workbook.create_sheet('demo')
    for i in range(lines):
        data = (i, f'name{i}', f'http://www.example.com/{i}')
        worksheet.append(data)
    workbook.save('1000lines.xlsx')
  
def test_read_1000_lines_data():
    workbook = openpyxl.load_workbook('1000lines.xlsx')
    worksheet = workbook['demo']
    for row in worksheet.values:
        pass

插入 1000 条数据会消耗多少时间呢?答案是 0.09 秒,速度并不慢。而读取这 1000 条测试数据消耗的时间,只需要 0.06 秒。

在这里插入图片描述
在一个项目当中,1000 个测试用例应该是比较合理的,所以在正常的测试场景下,使用 Excel 管理用例数据在读取效率上是合适的。

但是当数据变得越来越大的时候,Excel 的处理速度会越来越慢,读取数据消耗了 7 秒。这就意味着如果你有多个项目需要同时测试,Excel 的解析可能会对测试效率造成一定的影响。

再看 CSV 格式

不论是进行自动化测试还是进行数据分析,CSV 格式都更加合适。这种格式不像 Excel,要去处理表格的样式,它更专注于数据。

而且在 Python 语言当中,内置了 CSV 格式的处理模块,用法非常简单,没有太多额外的学习成本。


import csv


def test_insert_1000_lines_data():
    lines = 1000
    with open('1000lines.csv', 'w', newline='') as f:
        csv_writer = csv.writer(f)
        for i in range(lines):
            data = (i, f'name{i}', f'http://www.example.com/{i}')
            csv_writer.writerow(data)
          
def test_read_1000_lines_data():
    with open('1000lines.csv', newline='') as f:
        csv_reader = csv.reader(f)
        for row in csv_reader:
            print(row)

分别对 1000 行、5 万行和 10 万行数据进行插入和读取操作,CSV 的速度都比 Excel 要快一个量级。


对于海量数据处理,CSV 比 Excel 要快很多,代码编写也更简单。

但是,使用 CSV 格式一定要注意对逗号的处理。

在 CSV 当中,每一行的数据默认是用逗号分割的,如果你有一个数据当中本身就包含了逗号,一定要记得把这个数据用双引号包裹。

而且,CSV 支持的数据格式非常有限,数据被读取出来后都被当成字符串,需要自己添加额外的解析操作。

id,17,18,“{‘name’: ‘yuz’, ‘age’: 11}”

最后,看看 YAML 表现怎么样?

YAML 的优点在于丰富的数据类型支持。无论是元组、字典、数字、布尔类型都能支持,并且被 python 语言轻松解析成对应的 python 数据类型。


import yaml


def test_insert_1000_lines_data():
    lines = 1000
    with open('1000lines.yaml', 'w') as f:
        all_data = [{"id": i,
                     "name": f"name{i}",
                     "data": {"username": "yuz", "passoword": 123456}}
                    for i in range(lines)]
        yaml.safe_dump(all_data, f)


def test_read_1000_lines_data():
    with open('1000lines.yaml',
              encoding='utf-8') as f:
        data = yaml.load(f, Loader=yaml.SafeLoader

在少量数据的解析上,YAML 会非常的方便。但是一旦数据增加到上万组,YAML 的解析速度会非常非常慢。当数据达到 10 万行的时候,读取速度竟然接近 1 分钟。


最近有越来越多的自动化测试人员使用 YAML 存储用例,一方面是看重了它支持的丰富的数据格式,另一方面可能是受了一些框架的影响。

httprunner 这个接口自动化测试框架就采用了 YAML 存储用例数据。其实当存在海量数据需要读取的时候,YAML 的处理速度比 Excel 慢一个量级。

所以 httprunner 这样的框架,从测试效率这个维度来讲,更适合做单用例或者少量用例的测试。如果想针对整个项目甚至是多个项目一次性测试的话,httprunner 的执行速度会比较慢。

结 论

通过对 Excel、CSV 和 YAML 三种格式的操作效率对比可以得出以下结论。

一、如果你只想对少量的用例进行测试,或者对测试数据的格式要较高的要求,用 YAML 存储用例数据会更利于解析,但是这种场景下一般可以直接使用 postman 这些成熟的工具,没有必要自己实现。

二、如果你已经习惯了 Excel 的操作。直接使用这种方式就可以了,1 万行以下的数据, Excel 还是非常快的。

三、不管怎么样,我还是更推荐大家去尝试一下 CSV 这种格式。首先、就算是到了 10 万行数据的情况下,它的处理速度也是非常快的。其次,Python 语言当中直接内置了 CSV 的模块,它的使用方式和 open.函数非常的相似,几乎没有额外的学习成本。


最后

如果你想学习自动化测试,那么下面这套视频应该会帮到你很多

如何逼自己1个月学完自动化测试,学完即就业,小白也能信手拈来,拿走不谢,允许白嫖....

最后我这里给你们分享一下我所积累和整理的一些文档和学习资料,有需要直接领取就可以了!


以上内容,对于软件测试的朋友来说应该是最全面最完整的备战仓库了,为了更好地整理每个模块,我也参考了很多网上的优质博文和项目,力求不漏掉每一个知识点,很多朋友靠着这些内容进行复习,拿到了BATJ等大厂的offer,这个仓库也已经帮助了很多的软件测试的学习者,希望也能帮助到你。

​​

​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1177798.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

64位Office API声明语句第112讲

跟我学VBA,我这里专注VBA, 授人以渔。我98年开始,从源码接触VBA已经20余年了,随着年龄的增长,越来越觉得有必要把这项技能传递给需要这项技术的职场人员。希望职场和数据打交道的朋友,都来学习VBA,利用VBA,起码可以提高…

Linux开发工具的使用(vim、gcc/g++ 、make/makefile)

文章目录 一 :vim1:vim基本概念2:vim的常用三种模式3:vim三种模式的相互转换4:vim命令模式下的命令集- 移动光标-删除文字-剪切/删除-复制-替换-撤销和恢复-跳转至指定行 5:vim底行模式下的命令集 二:gcc/g1:gcc/g的作用2:gcc/g的语法3:预处理4:编译5:汇编6:链接7:函…

【ARFoundation学习笔记】ARFoundation基础(下)

写在前面的话 本系列笔记旨在记录作者在学习Unity中的AR开发过程中需要记录的问题和知识点。难免出现纰漏,更多详细内容请阅读原文。 文章目录 TrackablesTrackableManager可跟踪对象事件管理可跟踪对象 Session管理 Trackables 在AR Foundation中,平面…

大厂面试题-b树和b+树的理解

为了更清晰的解答这个问题,从三个方面来回答: a.了解二叉树、AVL树、B树的概念 b.B树和B树的应用场景 1.B树是一种多路平衡查找树,为了更形象的理解,我们来看这张图。 二叉树,每个节点支持两个分支的树结构&#xff…

第十五届全国交通运输领域青年学术会议,和鲸 Heywhale 携手龙船科技联合发布科研服务解决方案

2023年10月29日,由中国交通运输协会青年科技工作者工作委员会主办,集美大学承办的“第十五届全国交通运输领域青年学术会议”在一片热烈的氛围中圆满落幕。 本届会议以“低碳•智能•安全•可持续综合交通发展创新”为主题,围绕综合立体交通…

JavaScript_document对象_方法_获取元素

1、document.getElementsByTagName 2、 document.getElementsByClassName() document.getElementsByClassName方法返回一个类似数组的对象(HTMLCollection实例),包括了所有class名字符合指定条件的元素,元素的变化实时反映在返回…

FL Studio21.2中文高级版数字音乐工作站(DAW)

FL Studio是一款功能强大的数字音乐工作站(DAW),软件提供了丰富的功能和工具,使音乐制作变得更加轻松和富有创意性。而在其中,一个关键的功能就是Fruity Wrapper,它在FL Studio中扮演着重要的角色。接下来给…

idea必装插件EditStarters(快速引入依赖)

前言 一般来说我们要向一个 servlet 或者 Spring 项目中引入依赖都需要先到中心仓库找到对应的依赖,选择依赖的版本,把依赖添加到配置文件 pom.xml 中,这其实还是有点麻烦的,而通过 EditStarters 插件我们可以迅速的添加依赖到项目…

计算机网络第4章-IPv6和寻址

IP地址的分配 为了获取一块IP地址用于一个组织的子网内,于是我们向ISP联系,ISP则会从已分给我们的更大 地址块中提供一些地址。 例如,ISP也许已经分配了地址块200.23.16.0/20。 该ISP可以依次将该地址块分成8个长度相等的连续地址块&…

Jakarta-JVM篇

文章目录 一.前言1. 1 JVM-堆常用调参1.2 JVM-方法区常用参数1.3 JVM-codeCache 二.JVM内存结构三. 对象创建四. JVM垃圾回收算法4.1 可达性分析算法4.1.1 对象引用4.1.2 回收方法区. 4.2 分代回收4.3 标记清除4.4 标记复制4.5 标记整理 五.垃圾回收器5.1 根节点枚举5.2 安全点…

2023-11-06今日最大收获:坑爹的 JpaRepository!

1.坑爹的 JpaRepository! org.springframework.dao.InvalidDataAccessResourceUsageException: could not extract ResultSet; SQL [n/a]; nested exception is org.hibernate.exception.SQLGrammarException: could not extract ResultSet 2023-11-06 18:38:53.12…

光链路测试6271B光纤温度分布测试仪

6271B 光纤温度分布测试 6271B 光纤温度分布测试仪主要基于光纤拉曼散射效应和光时域反射技术研制,利用温度传感光缆(纤),实现空间温度的在线、实时、连续分布式测试。光纤温度分布测试仪由主机(信号处理单元&#xff…

c++学习之AVL树

目录 一,什么是AVL树 二,AVL树的实现 结构体 insert 左单旋 右单旋 双旋 双旋右边高 双旋左边高 最终实现的插入函数 遍历 判断平衡 一,什么是AVL树 在之前,我们已经了解到了二叉搜索树,提到过它的搜索效率…

【OS】操作系统课程笔记 第六章 并发性——死锁

6.1 死锁的概念 所谓死锁,是指多个进程因竞争资源而造成的一种僵局,若无外力作用,这些进程都将永远不能再向前推进。 下面举个例子,进程P1已经占用了资源R1,进程P2已经占用了资源R2,而P1和P2都要同时使用…

全自动批量AI改写文章发布软件【软件脚本+技术教程】

项目原理: 利用AI工具将爆款文章改写发布到平台上流量变现,通过播放量赚取收益 软件功能: 1.可以根据你选的文章领域,识别你在网站上抓取的文章链接进来自动洗稿生成过原创的文章,自动配图 2.同时还可以将管理的账号导入进脚本软…

Java基础(第五期): 一维数组 二维数组 数组 引用数据类型在内存中的存储图解

Java基础专栏 文章目录 一、数组介绍和静态初始化1.1 数组初始化1.2 数组的定义格式1.3 数组的静态初始化格式 二、 数组元素访问三、数组遍历操作四、数组遍历求和等练习2.数组求最大值 五、数组动态初始化六、两种初始化的区别七、数组内存图和方法参数传递八、二维数组静态…

深入详解高性能消息队列中间件 RabbitMQ

目录 1、引言 2、什么是 RabbitMQ ? 3、RabbitMQ 优势 4、RabbitMQ 整体架构剖析 4.1、发送消息流程 4.2、消费消息流程 5、RabbitMQ 应用 5.1、广播 5.2、RPC VC常用功能开发汇总(专栏文章列表,欢迎订阅,持续更新...&am…

【工具使用-信号叠加演示】一种演示不同频率信号叠加的工具

一,简介 本文主要介绍一种网页演示不同频率的正弦信号叠加的工具,供参考。 二,说明 网址:https://teropa.info/harmonics-explorer/ 打开后可以设置不同的信号,然后最上面是不同信号的频率叠加之后的效果&#xff…

Blender vs 3ds Max:谁才是3D软件的未来

在不断发展的3D建模和动画领域,两大软件巨头Blender和3ds Max一直在争夺顶级地位。 随着技术的进步和用户需求的演变,一个重要问题逐渐浮出水面:Blender是否最终会取代3ds Max?本文将深入探讨二者各自的优势和劣势、当前状况&…

2024好用免费的mac苹果电脑杀毒软件CleanMyMac

杀毒软件在苹果家族中是一个小众软件,百度搜索苹果电脑杀毒软件,可能各种杀软良莠不齐,因为在这个市场非常小,绝大多数都是冲着“清理”去的,而不是杀毒。最近测试了一款Mac电脑杀毒软件,杀毒效果也是一般般…