大数据平台测试

news2024/11/25 2:47:44

简介: 一.大数据平台测试简述 大数据平台测试包括2部分:基础能力测试和性能测试 Ⅰ).基础能力测试 大数据平台的基本功能和数据的导入导出对SQL任务、NoSQL任务、机器学习、批处理任务的支持 大数据平台是否能够通过界面的形式方便用户进行非运行维护,主要包括集群的安装、监控、配置、操作等 大数据平台是否能够提供基本的安全方案 a).

一.大数据平台测试简述

大数据平台测试包括2部分:基础能力测试和性能测试

Ⅰ).基础能力测试

  1. 大数据平台的基本功能和数据的导入导出对SQL任务、NoSQL任务、机器学习、批处理任务的支持
  2. 大数据平台是否能够通过界面的形式方便用户进行非运行维护,主要包括集群的安装、监控、配置、操作等
  3. 大数据平台是否能够提供基本的安全方案
  • a).是否具备认证功能以防止恶意访问和攻击
  • b).是否能够进行细粒度的权限管理
  • c).是否能够提供审计和数据加密功能
  1. 大数据平台是否具备高可用的机制,防止机器的失效带来的任务失败以及数据丢失
  2. 大数据平台是否能够支持机器快速平滑地扩展和缩容时带来线性的计算能力
  3. 大数据平台是否能够支持多个调用接口以及对SQL语法的支持情况
  4. 大数据平台是否能够根据队列、用户的权重来细粒度地分配计算资源

Ⅱ).性能测试

  1. 基准测试:数据生成、负载选择和明确测试指标等内容
  2. 性能测试:基准测试之上的扩展

二.大数据平台测试流程

Ⅰ).数据生成

BDGS: 能够快速生成保持真实数据特性的文本、表和图数据的数据生成工具

BDGS构造方法

  • a).数据筛选:选取代表性的真实数据集和相应的建模方法或工具
  • b).原始数据处理:对真实数据采样并建模,提取数据特性
  • c).数据生成:通过参数控制数据规模和并行度
  • d).格式转化:根据负载的输入需求转换生成数据的格式

Ⅱ).负载选择

负载选择策略: 负载需覆盖大数据处理平台的主要组件即分布式计算框架、分布式文件系统和分布式存储的能力

Ⅲ).测试指标

主要从性能、能耗、性价比和可用性4个维度来测试对比平台性能

三.大数据平台测试工具

Ⅰ).平台单组件测试

测试应用单一、效率高、成本低,但无法全面衡量大数据平台性能

Ⅱ).综合平台测试

覆盖面广,可以较全面测试衡量大数据平台不同类型任务的性能,通用性好

测试工具BigDataBench:

  • a).概念:是一个跨系统、体系结构、数据管理 3个领域的大数据基准测试开源程序集
  • b).应用领域:搜索引擎、电子商务、社交网络、多媒体、生物信息
  • c).负载类型:离线分析、交互式分析、在线服务、Nosql
  • d).数据类型:结构化、半结构化、非结构化

测试工具Hibench:

  • a).概念:是一个大数据基准测试套件,可帮助评估大数据框架的速度,吞吐量和系统资源利用率
  • b).测试范围:HadoopBench、SparkBench、StormBench、FlinkBench、GearpumpBench、机器学习、网页搜索
  • c).负载类型:实时场景、离线场景
  • d).数据类型:结构化、半结构化
  • e).功能模块:对于hive:(aggregation,scan,join)、排序(sort,TeraSort)、大数据基本算法(wordcount,pagerank,nutchindex)、机器学习算法(kmeans,bayes)、集群调度(sleep)、吞吐(dfsio)、5.0版本的流测试

测试工具TPCx-HS Kit

  • a).概念:第一个标准化的大数据基准测试,旨在对Hadoop集群进行压力测试
  • b).囊括模块:HSGen数据生成器、HSDataCheck检查数据集和副本的符合性、HSSort数据排序、HSValidatate排序后的数据校验
  • c).测试指标:性能、价格性能和可用性
  • d).负载类型:实时场景、离线场景

测试工具BSMA

  • a).概念:基于Yahoo的YCSB的大数据性能测试工具
  • b).测试场景:社交网络查询、热点查询、时间线查询
  • c).负载类型:离线分析、Nosql
  • d).测试指标:吞吐量、延时、可伸缩性

Ⅲ).应用领域端到端测试

可以与企业场景的实际业务场景结合,覆盖企业大数据业务的全流程模拟测试

测试工具BigBench

  • a).概念:于2016年2月被TPC委员会接受以后被命名为TPCx-BB,在此之前叫BigBench;TPCx-BB性能评估标准有两个,一是根据软硬件性能评估,二是根据软硬件性价比评估
  • b).测试领域:零售商
  • c).负载类型:离线分析
  • d).数据类型:结构化、半结构化、非结构化

四.大数据平台测试用例

Ⅰ).平台基准测试用例

主要是从性能的角度衡量大数据平台,包括数据生成、负载选择和明确测试指标等内容

Ⅱ).平台性能测试用例

在基准测试的基础上扩展测试内容,增加SQL任务测试比重

Ⅲ).平台基础能力测试用例

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1004210.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PCIE2.0/PCIE3.0/PCIE4.0/PCIE5.0接口的带宽、速率计算,nvlink互联

PCIE2.0/PCIE3.0/PCIE4.0/PCIE5.0接口的带宽、速率计算 https://blog.csdn.net/weixin_42229404/article/details/84069859 PCI-Express(peripheral component interconnect express)是一种高速串行计算机扩展总线标准,它原来的名称为“3GIO”,是由英特…

虚拟机突然无法访问外部网络的现象集合

现场还原 虚拟机突然无法访问外部网络 ping 8.8.8.8的时候显示网络不可达 ping 8.8.8.8ping www.baidu.com(报:未知的名称或服务或请求超时) ping www.baidu.comyum操作 也提示错误:为仓库 ‘appstream’ 下载元数据失败 : C…

device or resource busy

最近要删除ubuntu下面的某个文件的时候,突然报错: "device or resource busy", 于是通过 如下命令: lsof | grep /projects/m/CMLR_processed_codeformer_HD/20110330/02313/.nfs0000000001dedb1b00000003 发现是 5953号进程占用了,于是kill…

win11鼠标指针怎么设置

win11有很多自定义的功能,这个功能可以让我们根据自己的喜好进行系统的自定义设置,很多小伙伴在将电脑更新成win11之后不知道该怎么设置鼠标指针,这里小编就给大家带来win11鼠标指针的设置方法,还不太清楚的小伙伴快来跟小编一起了…

SpringMvc第五战-【SpringMvcJSR303和拦截器】

前言: 小编阐述了springmvc 中的文件下载,以及jrebel的使用和文件下载以及多文件下载! 在本次小编将会介绍JSR303的概念,应用场景和在具体实例的使用;和拦截器的应用 一.JSR303的介绍 1.什么是JSR303? JSR是Java S…

清理不干净等于白清理!如何擦除所有个人数据并擦除iPhone和iPad

我们大多数人每天都在使用iPhone和iPad。在设备的使用寿命中,我们会积累大量敏感数据和信息,包括消息、照片、视频、联系人、信用卡、密码等等。这就是为什么确保你有所有重要物品的备份很重要,这样你就可以在卖掉或交给别人之前把它扔掉。 …

13.6 Production State Awareness (PSA)

1. Introduction UFS设备可以利用有关其生产状态的知识,相应地调整内部操作。 例如,在设备焊接之前加载到存储设备中的内容可能被破坏,其概率高于regular模式。UFS设备可以在设备焊接前使用“Special”内部操作加载内容,这将减少…

返回值加const ,为了不拷贝得到成员的值,但被赋值的左值也要const

1. getA 函数返回值 什么都不加,也改不了c里面a的指针指向 why?返回成员变量时,会复制一下。 返回成员变量时,一般会赋值一下没有RVO_地摊书贩的博客-CSDN博客 2. getA 函数返回值 加了引用, 就没有复制 3. getA 函数…

04JVM_语法糖

一、编译期处理 语法糖java编译器把*.java源码编译为*.class字节码的过程中,自动生成和转换的一些代码(添加的class字节码),减轻程序员的负担。 1.默认构造器 默认构造器没有写任何的构造方法,但经过编译器编译成字…

pdfjs解决ie浏览器预览pdf问题

pdfjs是一个js库,可以将pdf文件用canvas重新绘制,从而无需借助pdf读取插件就可以直接预览。 目前chrome内核的浏览器已内置pdf读取插件,但ie浏览器还没有。而我们最近在做的一个项目使用对象是医院,使用的浏览器竟然还是ie。所以我…

@BeforeEach与@AfterEach

BeforeEach 修饰在方法上,在每一个测试方法(所有Test、RepeatedTest、ParameterizedTest或者TestFactory注解的方法)之前执行一次。 例如:一个测试类有2个测试方法testA()和testB(),还有一个BeforeEach的方法&#x…

安科瑞ADL400产品功能及参数说明,适用于5G基站计量使用

安科瑞虞佳豪壹捌柒陆壹伍玖玖零玖叁 “十四五”以来,重庆新型数字基础设施建设取得明显成效,截至今年6月底,每万人拥有5G基站数24个,5G发展保持在全国第一梯队。 新型数字基础设施包括5G网络、千兆光网、数据中心、工业互联网、…

Mysql高级——存储引擎

存储引擎 1). 连接层 最上层是一些客户端和链接服务,包含本地sock 通信和大多数基于客户端/服务端工具实现的类似于 TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程 池的概念,为通过认证安全接入的客户端提…

潍坊学院图书馆藏《乡村振兴战略下传统村落文化旅游设计》许少辉八一新书

潍坊学院图书馆藏《乡村振兴战略下传统村落文化旅游设计》许少辉八一新书

教师必看,如何巧妙告知学生家长成绩分数?

亲爱的教师们!今天博主要跟你们分享一个巧妙的方法,帮助你们与学生家长发布成绩分数时让他们更好的了解孩子的学习情况。是不是觉得很有用?那就跟我一起来看看吧。 我们可以借助一个神奇的工具——易查分。它能把成绩分数以在线查询的形式呈现…

AD22使用笔记+积累库

一、前言 使用AD9习惯了,但是需求逐渐上来了就不够用了,好多快捷的新功能要新版本软件才能用,所以升级使用AD22 目录 1.添加层之后中间层无法布线 2.新增快捷方式CtrlW布线,不用点图标了 二、环境 AD22 三、正文 1.添加层之…

软件设计模式(七):适配器、桥梁、命令、原型模式

前言 这是软件设计模式系列的最后一篇文章,对于23种设计模式荔枝梳理了比较重要的几种,剩下的在实际开发中用的也比较少哈哈哈。在这篇文章中荔枝主要梳理软件设计模式中的适配器模式、桥梁模式、命令模式和原型模式的相关知识。希望能帮助到有需要的小伙…

选择器进阶与表单表格

华子目录 选择器并集选择器后代选择器子代选择器伪类选择器伪元素选择器结构选择器属性选择器相邻选择器 表单(form)label标签 表格(table标签) 选择器 下面是我们之前学习过的选择器 *{}:通配符选择器,选…

JDK8新特性--函数式接口--(Consumer的概念理解,模拟练习,企业实战)全流程彻底搞懂

背景,起因是因为在项目开发过程中,发现了一处代码的写法觉得很新奇看不懂,了解后发现是用到了函数式接口的知识。特此学习记录,整体过程梳理在本文。如果你不满足就会写个CURD,业务代码只会new来new去,代码…

Spring 中三种 BeanName 生成器!

无论我们是通过 XML 文件,还是 Java 代码,亦或是包扫描的方式去注册 Bean,都可以不设置 BeanName,而 Spring 均会为之提供默认的 beanName,今天我们就来看看 Spring 中三种处理不同情况的 beanName 生成器。 1. BeanN…