R语言统计分析——箱线图

news2025/4/21 10:37:52

参考资料:R语言实战【第2版】

        箱线图(又称盒须图)通过绘制连续型变量的五数总括,即最小值、下四分位数(第25百分位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最大值,描述了连续型变量的分布。

        箱线图能够显示出可能为离群点(范围±1.5*IQR以外的值,IQR表示四分位距,即上四分位数与下四分位数的差值)的观测。

        默认情况下,两条须的延伸极限不会超过盒型各端加1.5倍四分位距的范围,此范围以外的值将以点来表示。

1、使用并列箱形图进行跨组比较

        箱线图可以展示单个变量或分组变量。使用格式为:

        boxplot(formula,data=dataframe)

其中,formula是一个公式,dataframe代表提供数据数据框(或列表)。一个示例公式为:有~A,这将为类别型变量A的每个值并列地生成数值型变量的y的箱线图。公式y~A*B则价格为类别型变量A和B所有水平的两两组合生成数值型变量y的箱线图。

        田间参数varwidth=TRUE将是箱线图的宽度与其样本大小的平方根成正比。参数horizontal=TRUE可以反转坐标轴的方向。

boxplot(mpg~cyl,data=mtcars,
        main="Car Mileage Data",
        xlab="Number of Cylinder",
        ylab="Mile Per Gallon")

        结果解读:不同组间油耗的区别非常明显。且:六缸车型的每加仑汽油行驶的英里数分布较其他两类车型更为均匀。与六缸和八缸车型相比,四缸车型的每加仑汽油行驶的英里数分布最广。

        箱线图灵活多变,通过添加notch=TRUE,可以得到含有凹槽的箱线图。若两个箱的凹槽互不重叠,则表明他们的中位数有显著差异。

boxplot(mpg~cyl,data=mtcars,
        notch=TRUE,
        varwidth=TRUE,
        col="red",
        main="Car Mileage Data",
        xlab="Number of Cylinders",
        ylab="Miles Per Gallon")

        由上图可看出四缸、六缸、八缸的油耗中位数是明显不同的,随着汽缸数的增加,每加仑汽油行驶里程约小。即随着汽缸数的减少,油耗明显降低。

# 两个交叉因子的箱线图
mtcars$cyl.f<-factor(mtcars$cyl,
                     levels=c(4,6,8),
                     labels=c("4","6","8"))
mtcars$am.f<-factor(mtcars$am,
                    levels=c(0,1),
                    labels=c("auto","standard"))
boxplot(mpg~am.f*cyl.f,
        data=mtcars,
        varwidth=TRUE,
        col=c('gold','darkgreen'),
        main="MPG Distribution by Auto Type",
        xlab="Auto Type",
        ylab="Miles Per Gallon")

2、小提琴图

        小提琴图(violin plot)是箱线图的一个变种。小提琴图是箱线图与核密度图的结合。可以使用vioplot包中的vioplot()函数进行绘制。第一次使用之前需要安装vioplot包。

        注意,vioplot()函数需要将绘制的不同组分离到不同的变量中。

install.packages("vioplot")
library(vioplot)
x1<-mtcars$mpg[mtcars$cyl==4]
x2<-mtcars$mpg[mtcars$cyl==6]
x3<-mtcars$mpg[mtcars$cyl==8]
vioplot(x1,x2,x3,
        names=c("4 cyl","6 cyl","8 cyl"),
        col="gold")
title("Vilon Plots of Miles Per Gallon",
      xlab="Number of cylinders",
      ylab="Miles Per Gallon")

        小提琴图基本上是核密度图以镜像方式在箱线图上的叠加。在上图中:白点是中位数,黑色盒型的方位是下四分位数到上四分位数,细黑线表示须。外部形状即为和密度估计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1969585.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux真实机器安装

引言 装机电脑&#xff1a;具有网卡硬件、磁盘空间 > 64G、内存空间 > 4G&#xff1b; 装机工具&#xff1a;rufus&#xff0c;u盘&#xff08;8G&#xff09;&#xff1b; 装机系统&#xff1a;centos7.iso&#xff1b; 联网工具&#xff1a;路由器&#xff0c;网线 1.…

大学新生如何高效入门编程?全面指南来助力

引言 在当今数字化时代&#xff0c;编程已经成为一项必备技能。无论你未来从事什么职业&#xff0c;编程能力都能为你的职业生涯增添光彩。对于即将步入大学的新生来说&#xff0c;如何高效入门编程是一道关键课题。本文将从如何选择编程语言、制定学习计划、找到顶尖学习资源…

汇昌联信科技拼多多运营如何?

汇昌联信科技拼多多运营如何?在电商行业&#xff0c;拼多多的崛起无疑为许多企业带来了新的机遇。作为一家专注于电子商务解决方案的公司&#xff0c;汇昌联信科技在拼多多的运营方面展现出了不俗的实力。他们不仅成功帮助多个品牌入驻拼多多平台&#xff0c;还通过精细化运营…

缺口将达到1000万?人工智能(AI)专业就业前景分析

从年初以来&#xff0c;人工智能一直占据着热话题榜首。随着人工智能技术的不断发展和应用&#xff0c;人工智能&#xff08;AI&#xff09;专业已经成为了近年来大学校园里最热门的专业之一&#xff0c;成为连续四年新增最多专业。 今天给大家介绍一下&#xff0c;为感兴趣的…

申瓯通信在线录音管理系统Thinkphp远程代码执行漏洞

目录 1.产品简介 2.漏洞概述 3.搜索语法 4.漏洞复现 1.产品简介 申瓯通信在线录音管理系统是一款功能强大的录音管理解决方案&#xff0c;旨在满足公司、集团单位在区域分布下对录音数据的集中管理需求。该系统基于SOC1900、S0C1600等系列录音盒开发&#xff0c;是一个多线…

VMWare虚拟机共享主机的网络访问外网

1.主机中启动客户端并连接外网 2.设置虚拟网络类型为NAT 3.启动虚拟并通过主机访问外网

从“人巡”到“智控”:EasyCVR智能视频监控技术变革河道违建监测模式

一、背景分析 随着城市化进程的加快&#xff0c;河道作为城市生态系统的重要组成部分&#xff0c;其保护与管理日益受到重视。然而&#xff0c;非法侵占河道、违规建设等行为时有发生&#xff0c;不仅破坏了河道的自然生态&#xff0c;还严重威胁到防洪安全和水质安全。为了有…

Google发布三款开放式人工智能模型 重点关注安全问题

Google发布了三款新的、“开放的"人工智能生成模型&#xff0c;并称这些模型比大多数模型"更安全”、“更小巧”、“更透明”。它们是Google Gemma 2生成模型系列的新成员&#xff0c;该系列于今年 5 月首次亮相。这些新模型包括 Gemma 2 2B、ShieldGemma 和 Gemma S…

Xpath元素定位

Xpath元素定位 xpath初识元素失效的场景元素失效的原因语法书写如何进行校验 xpath实战元素定位分析流程书写&#xff08;一&#xff09;流程书写&#xff08;二&#xff09; xpath初识 元素失效的场景 元素失效的原因 元素缺少class和index的定位其中class和id的属性会改变元…

计算机网络-IGMP Snooping特性

一、以太网的组播转发问题 当组播数据从最后一跳路由器发往组播组成员时&#xff0c;往往会经过交换机。由于组播数据的目的MAC地址是组播MAC地址&#xff0c;默认情况下交换机将泛洪此类数据帧&#xff0c;有可能导致不同组的组播流量会被别组的成员接收。 当Router将组播报文…

mysql更改密码后,若依 后端启动不了解决方案

我原先的mysql 密码是 数字字符串 我想改成000 纯数字 改完之后&#xff0c;连接的数据库的代码 也更改后 &#xff0c;后端启动不了 因为原先 密码数字字符串 不需要用引号" " 括起来 我改成纯数字 需要用 " " 括起来 如下图 然后就可以运行成功了

KineFX —— Skeleton

一&#xff0c;KineFX skeletons介绍 在KineFX内&#xff0c;每件事都是SOP point&#xff0c;点的世界变换&#xff08;translation, rotation, scale&#xff09;由positionmatrix3*3定义&#xff1b; 当一个点具有transform和name属性&#xff0c;点就是一个joint&#xff…

RabbitMQ发送者重连、发送者确认

RabbitMQ发送者重连、发送者确认 一、发送者重连 spring:rabbitmq:connection-timeout: 1s #设置MQ的连接超时时间template:retry:enabled: true #开启超时重试机制initial-interval: 1000ms #失败后的初始等待时间multiplier: 1 #失败后下次的等待时长倍数&#xff0c;下次等…

Axure中文版资源免费下载!

Axure是一种专业的原型设计工具&#xff0c;可以帮助用户以最快的速度将产品想法转化为可视化原型&#xff0c;为设计师、产品经理和开发人员之间的沟通搭建桥梁。Axure功能强大&#xff0c;可绘制高保真原型、建立动态面板、使用复杂函数库、多人合作设计、标准化导出等功能&a…

一文带你读懂GPU算力在不同行业的应用!

随着科技的飞速发展&#xff0c;图形处理器&#xff08;Graphics Processing Unit, GPU&#xff09;已经不仅仅局限于图形渲染的传统领域&#xff0c;其强大的并行计算能力在多个行业得到了广泛应用。GPU算力&#xff0c;即图形处理器所提供的计算能力&#xff0c;正逐步成为推…

大模型之多模态大模型技术

本文作为大模型综述第三篇,介绍语言大模型多模态技术。 不同于语言大模型只对文本进行处理,多模态大模型将文本、语音、图像、视频等多模态数据联合起来进行学习。多模态大模型融合了多种感知途径与表达形态, 能够同时处理和理解来自不同感知通道(例如视觉、听觉、语言和触…

Python数值计算(1)——Numpy中数据的保存和加载

这里讨论一下在进行数值计算中&#xff0c;对计算数据的保存和加载。 1. 文本格式 这种方式可以采用文本的方式保存numpy数组&#xff0c;函数原型如下&#xff1a; numpy.savetxt(fname, X, fmt%.18e, delimiter , newline\n, header, footer, comments# , encodingNone) …

全源最短路问题:Floyd算法详解【经典算法,限时免费】

文章目录 最短路问题概述带边权的图的全源最短路径Floyd算法解决全源最短路问题dist数组初始化dist数组迭代以及动态转移方程Floyd算法求解dist数组完整代码pythonjavacpp时空复杂度 *Floyd算法正确性证明证明过程初始情况归纳假设归纳步骤终止条件 完整证明 相关题目 最短路问…

log4j2 远程代码执行漏洞复现(CVE-2021-44228)

目录 一、相关概念 二、漏洞复现 步骤一&#xff1a;执行一下命令启动靶场环境并在浏览器访问&#xff01;&#xff01;&#xff01; 1.启动命令 2.访问网址 步骤二&#xff1a;先在自己搭建的DNSLOG平台上获取一个域名来监视我们注入的效果... 步骤三:可以发现 /solr/ad…

小米手机通知栏横条无法清除 刻晴主题 历史通知记录功能使用方案

问题环境&#x1f495; Root K50 Ultra HyperCeiler &#xff08;系统修改&#xff09; Lspose&#xff08;框架&#xff09;魔改刻晴主题&#xff08;自用&#xff09;隐藏&#xff08;最近任务&#xff09;后台 在搞机过程中出现过如下情况 通知条无法被清除&#xff0c;导…