【数据挖掘】实验1:R入门(内含详细R和RStudio安装教程)

news2025/1/10 22:24:12

实验1:R入门

一:实验目的与要求

1:根据上课PPT内容,掌握课堂知识并进行代码练习操作,提供练习过程和结果。

2:可COPY代码运行结果直接提交,如涉及到输出图等可截图。

二:实验内容

1:R语言的下载与安装

1.1:安装R语言

从清华镜像网站(The Comprehensive R Archive Network)处下载Windows版本的R语言。点击下图中的【Download R-4.3.2 for Windows】即可下载。

下载完成后出现以下文件,双击该文件进行R语言的安装。

弹出【选择语言】后,选择默认的中文(简体),点击确定。

弹出【信息】后,点击下一步。

弹出【选择安装位置】后,进行路径设置(此处使用默认路径),点击下一步。

弹出【选择组件】后,进行组件配置(此处使用默认配置),点击下一步。

弹出【启动选项】后,此处使用默认选项No,点击下一步。

弹出【选择开始菜单文件夹】后,选择程序快捷方式的放置位置(此处使用默认文件夹),点击下一步。

弹出【选择附加任务】后,选择偏好的附加快捷方式,点击下一步。

等待文件安装。

安装完成,点击结束。

 此时,可以发现桌面添加了快捷方式【R 4.3.2】。

1.2:安装RStudio

从在线教育综合平台——数据挖掘课程处下载RStudio的安装包。

下载完成后得到下图的文件【RStudio-2022.02.1】,双击进行RStudio的安装。

弹出安装向导界面后,点击下一步。

弹出【选择安装位置】后,选择安装的路径并确认磁盘空间是否足够,点击下一步。

弹出【选择开始菜单文件夹】后,填写文件夹名称,点击安装。

等待文件的安装。

安装完成后,点击完成。

如果桌面没有出现快捷方式,则需要打开安装路径,找到可运行的exe文件。此处推荐使用everything工具直接搜索RStudio。

开第一个搜索结果的路径,在子文件目录bin下找到rstudio.exe。

右键点击该exe,选择创建桌面快捷方式,弹出提示框后,点击是。

即可发现桌面上多出了该可执行文件的快捷方式。

双击运行RStudio后,可进入以下操作界面。

2:R语言的基本操作

2.1:查看R版本,并在R Console上输入简单命令


打开R,查看到第一行输出R version 4.3.2,可知R语言的版本。测试PPT中给出的赋值公式和加法计算案例。结果如下图所示。


同时,也可通过【version】命令查看R语言的版本。结果如下图所示,可以看到倒数第二行version.string的对应信息为R version 4.3.2。

2.2:在R Console上更新R


    采用方法1更新R时,输入【install.packages(“installr”)】,将出现以下结果。

选择China镜像后,即可安装程序包,安装结果如下图。

输入【library(installr)】,将出现以下结果。

输入【updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。可以发现本地的版本已经是最新。

同时,采用方法2更新R时,输入【installr::updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】,将出现以下结果。

2.3:在RStudio上检查更新


    首先点击工具栏的【Help】。

然后点击【Check for Updates】。

软件自动弹出以下更新内容。此处表明我们的RStudio已经是最新版本,无需更新。

2.4:RStudio界面的熟悉


RStudio的整体界面如下图所示。其中左上角为代码编辑区,左下角为命令控制台/代码执行区,右上角为资源栏,右下角为其他区。

同时,勾选代码编辑区的【Source on Save】以便自动保存代码,同时查看右侧两个按钮的功能。

第二个按钮(魔术棒)的功能如下图所示。

第一个按钮(放大镜)的功能如下图所示。

2.5:当前工作路径的修改和文件读取


在console中,通过getwd()读取当前工作路径,结果如下图所示。

同时,通过setwd()写入新的工作路径,并通过getwd()检查是否设置成功,结果如下图所示。

读取不在工作路径下的csv文件,结果如下图所示。

读取在工作路径下的csv文件,结果如下图所示。

其他工作路径设置的函数如下图所示。

函数ls()的使用结果如下图所示。

函数rm()的使用结果如下图所示。

函数help(options)的使用结果如下图所示。运行后界面右下角弹出help的内容。

工作空间的操作不再演示。

2.6:R扩展包的安装、载入和更新

安装class扩展包,结果如下图所示。

同时安装class和cluster扩展包,结果如下图所示。


在R console中利用【library(class)】载入,结果如下图所示。


在R console中利用【update.packages()】载入,结果如下图所示。

在R console中利用【help(package=’class’)】查看扩展包信息,结果如下图所示。

在Package中查看扩展包的更新情况,结果如下图所示。

 在R console中利用【installed.packages()[,c('Package','Version','LibPath')]】查看已经安装的扩展包,结果如下图所示(由于扩展包的数量过多,因此此处仅展示一部分扩展包内容)。

在R console中利用
【site="https://mirrors.tuna.tsinghua.edu.cn/CRAN"】
和【install.packages("ggplot2", repos=site)】安装绘图包ggplot2,结果如下图所示。

在R console中利用【if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")】和【BiocManager::install(version = "3.18")】安装生物信息包,结果如下图所示。

2.7:R常用操作案例尝试


【1】dir.create("C:/Users/86158/Desktop/myprojects")

【2】dir.create("C:/Users/86158/Desktop/myprojects/project1")

【3】setwd("C:/Users/86158/Desktop/myprojects/project1")

【4】getwd()

【5】options()

【6】options(digits=3)

【7】x<-runif(20)

【8】summary(x)

【9】hist(x)

【10】save.image("myfile")

3:R语言的课后练习

【1】打开帮助文档首页,并查阅其中的“Introduction to R”。

    方法1:使用命令:help.start()

方法2:点击工具栏中【Help】下的【R Help】,进入Help界面。

点击【Manuals】中的【An Introduction to R】。

查看R语言介绍的详细内容。

【2】安装vcd包。


使用命令:install.packages("vcd")

【3】列出vcd包中可用的函数和数据集。


    使用命令:help(package="vcd")

在右下角处,可以看到可使用的数据集,各个数据集由字母顺序进行排序。

【4】载入vcd包并阅读数据集Arthritis的描述。


    首先,找到Arthritis数据集所在的链接位置。

然后,得到该数据集的描述(风湿性关节炎),具体内容如下。

Arthritis Treatment Data

Description

Data from Koch & Edwards (1988) from a double-blind clinical trial investigating a new treatment for rheumatoid arthritis.

Usage

data("Arthritis")

Format

A data frame with 84 observations and 5 variables.

ID

patient ID.

Treatment

factor indicating treatment (Placebo, Treated).

Sex

factor indicating sex (Female, Male).

Age

age of patient.

Improved

ordered factor indicating treatment outcome (None, Some, Marked).

Source

Michael Friendly (2000), Visualizing Categorical Data: http://euclid.psych.yorku.ca/ftp/sas/vcd/catdata/arthrit.sas

References

G. Koch & S. Edwards (1988), Clinical efficiency trials with categorical data. In K. E. Peace (ed.), Biopharmaceutical Statistics for Drug Development, 403–451. Marcel Dekker, New York.

M. Friendly (2000), Visualizing Categorical Data. SAS Institute, Cary, NC.

Examples

Run examples

data("Arthritis")

art <- xtabs(~ Treatment + Improved, data = Arthritis, subset = Sex == "Female")

art

mosaic(art, gp = shading_Friendly)

mosaic(art, gp = shading_max)

根据上表可知,数据的格式为【患者ID、治疗方法、患者性别、患者年龄、治疗效果】。

另外,可以使用以下命令组合,获取上述内容。

命令编号

命令内容

1

install.packages("zoo")

2

library(grid)

3

library(zoo)

4

library(vcd)

5

help(Arthritis)

【5】显示数据集Arthritis的内容(直接输入一个对象的名称将列出它的内容)。

使用命令:Arthritis

输出数据共84条。

【6】运行数据集Arthritis自带的示例。

使用命令:example(Arthritis)

输出内容如下图所示。

Data处输出该数据集共包含84行数据,5列数据特性。

上面两个图输出了treatment(治疗方法)和improved(治疗效果)之间的Pearson residuals(皮尔逊残差)。关于Pearson residuals的解释如下图所示。

三:遇到的问题和解决方案


问题1:执行【updateR()】命令时,出现以下报错。

解决1:查询资料后(Rstudio > updateR() Error in file(con, "r") : 无法打开链结 此外: Warning message: In file(con, "r") : Int... - 简书),发现是镜像没有设置好,需要手动配置。只需要将执行命令变为【updateR(fast=TRUE,cran_mirror="https://mirrors.ustc.edu.cn/CRAN/")】即可。

问题2:执行【install.packages("class")】命令时,出现以下报错。

解决
2:查询资料后(R报错:WARNING: Rtools is required to build R packages, but is not currently installed._warning: rtools is required to build r packages bu-CSDN博客),需要从官网(Rtools43 for Windows)中先下载并安装RTools43。同时输入【chooseCRANmirror()】更改镜像源。

问题3:执行【source("https://bioconductor.org/biocLite.R")】命令时,出现以下报错。

解决3:通过官网(Bioconductor - Install)找到详细的安装方法,按照R为4.3版本的指示进行操作即可。即下图中原来ppt中的方法,现在已经不适用。


问题4:执行【library(vcd)】命令时,出现以下报错。

解决4:在执行上述命令前,使用命令【library(grid)】和【install.packages("zoo")】+【library(zoo)】。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1511795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3D Gaussian Splatting for Real-Time Radiance Field Rendering(慢慢啃,还是挺复杂的)

三个关键要素 从相机配准的过程中得到的稀疏点云开始&#xff0c;使用3D Gaussian表示场景; 3D Gaussian: 是连续体积辐射场能够防止不必要的空空间优化。对 3D Gaussion进行交叉优化和密度控制: 优化各向异性血方差对场景精确表示。使用快速可视感知渲染算法来进行快速的训练…

InnoDB和MyISAM存储引擎

InnoDB mysql默认存储引擎 支持事务&#xff0c;行级锁&#xff08;并发量大&#xff09;&#xff0c;外键约束&#xff0c;容量大&#xff0c;支持缓存&#xff0c;支撑主键自增&#xff0c; 全文检索&#xff0c;不存储表的总行数&#xff0c;需要sql逐行统计 MyISAM 不…

鸿蒙Harmony应用开发—ArkTS声明式开发(基础手势:RemoteWindow)

远程控制窗口组件&#xff0c;可以通过此组件控制应用窗口&#xff0c;提供启动退出过程中控件动画和应用窗口联动动画的能力。 说明&#xff1a; 该组件从API Version 9开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 该组件为系统接口。…

k8s+zabbix

一&#xff0c;环境&#xff1a; 1&#xff09;&#xff0c;k8s部署&#xff0c;master和node节点都部署成功 二&#xff0c;部署&#xff1a; 1&#xff09;&#xff0c;安装python3&#xff08;资源中有&#xff09; wget https://www.python.org/ftp/python/3.7.4/Python-…

【Mysql】事务与索引

目录 MySQL事务 事务的特性 并发事务的问题&#xff1f; 事务隔离级别&#xff1f; MySQL索引 数据结构 索引类型 聚簇索引与非聚簇索引 聚集索引的优点 聚集索引的缺点 非聚集索引的优点 非聚集索引的缺点 非聚集索引一定回表查询吗(覆盖索引)? 覆盖索引 联合索…

传输层协议介绍(tcp,udp),可靠性和不可靠性

目录 传输层协议 介绍 tcp协议 介绍 面向连接 可靠性 面向字节流 udp协议 介绍 无连接 不可靠 面向数据报 可靠和不可靠 可靠 不可靠 传输层协议 介绍 传输层是计算机网络体系结构中的第四层&#xff0c;它负责在网络中的不同主机之间提供端到端的数据传输 传输…

Web 常用的 扩展开发框架

当谈到提升浏览器功能和用户体验时&#xff0c;浏览器扩展成了一股强大的力量&#xff0c;备受用户青睐。在众多的Web扩展开发框架中&#xff0c;WXT和Plasmo凭借其丰富的工具和特性&#xff0c;以及简化的开发流程&#xff0c;成为开发者们的首选。在本文中&#xff0c;我们将…

基于 Jenkins 搭建一套 CI/CD 系统

一、CI/CD环境介绍 本次要实现如下效果&#xff0c;开发人员完成功能开发并提交代码到gitlab仓库&#xff0c;jenkins自动完成拉取代码、编译构建、代码扫描&#xff08;sonarqube&#xff09;、打包&#xff0c;再自动化完成部署到Tomcat服务器提供访问。 环境准备三台Centos…

jupyter 修改文件保存位置 步骤

一、找到配置文件位置 打开Anaconda Prompt&#xff0c;输入&#xff1a; jupyter notebook --generate-config 根据得到的路径&#xff0c;以记事本方式打开配置文件 二、修改路径 在文件中输入&#xff1a; c.NotebookApp.notebook_dir E:\\deepLearning\\Jupyter_files…

离线下载的pytorch/torchvision/torchaudio

链接&#xff1a;https://download.pytorch.org/whl/torch_stable.html 下载pytorch-torchvision-torchaudio等一系列一定要版本匹配&#xff0c;并且如果是在gpu上跑的话&#xff0c;一定要都是cu版本 参考链接&#xff1a;https://blog.csdn.net/AiTanXiing/article/detail…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的输电线路设备检测系统(深度学习+UI界面+Python代码+训练数据集)

摘要&#xff1a;本篇博客详细介绍了如何运用深度学习构建一个先进的输电线路设备检测系统&#xff0c;并附上了完整的实现代码。该系统利用了最新的YOLOv8算法作为其核心&#xff0c;同时也对之前版本的YOLOv7、YOLOv6、YOLOv5进行了性能比较&#xff0c;包括但不限于mAP&…

如何解决由触发器导致 MySQL 内存溢出?

由触发器导致得 OOM 案例分析过程和解决方式。 作者&#xff1a;龚唐杰&#xff0c;爱可生 DBA 团队成员&#xff0c;主要负责 MySQL 技术支持&#xff0c;擅长 MySQL、PG、国产数据库。 爱可生开源社区出品&#xff0c;原创内容未经授权不得随意使用&#xff0c;转载请联系小编…

为什么要有包装类?

1、典型回答 在 Java 中&#xff0c;所有的基本类型都会对应一个包装类&#xff0c;如下所示&#xff1a; 之所以要有包装类型的主要原因有以下几个&#xff1a; 面向对象要求&#xff1a;Java 是一门面向对象的编程语言&#xff0c;要求所有的数据都应该是对象。但是&#x…

【递归搜索回溯专栏】专题二:二叉树中的深搜----二叉搜索树中第K小的元素

本专栏内容为&#xff1a;递归&#xff0c;搜索与回溯算法专栏。 通过本专栏的深入学习&#xff0c;你可以了解并掌握算法。 &#x1f493;博主csdn个人主页&#xff1a;小小unicorn ⏩专栏分类&#xff1a;递归搜索回溯专栏 &#x1f69a;代码仓库&#xff1a;小小unicorn的代…

数据库三大范式设计原则

数据库三大范式 第一范式(确保每列保持原子性) 第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值&#xff0c;就说明该数据库表满足了第一范式。 第二范式(确保表中的每列都和主键相关) 第二范式在第一范式的基础之上更进一层。第二范式需要确保数据…

基于ARMA-GARCH模型探究股价的日历效应和节假日效应【思路+代码】

目录 1. 模型定义1.1 ARMA-GARCH模型1.2 引入节假日效应的虚拟变量的新模型1.3 引入日历效应的虚拟变量的新模型 2. 实证部分2.1 准备工作2.2 引入节假日效应虚拟变量的模型建立和结果分析2.3 引入节假日效应和日历效应的虚拟变量的模型建立和结果分析 3. 结语 本文介绍了ARMA-…

Ubuntu18.04 安装搜狗输入法

一. 概述 自己的Ubuntu 18.04系统配置中文搜狗输入法&#xff0c;安装步骤&#xff0c;亲测可用 二. 安装步骤 2.1 确认系统版本和CPU架构 查看Ubuntu系统版本号&#xff0c;通过命令 lsb_release -a wuubuntume:~$ lsb_release -a No LSB modules are available. Distr…

【全志H616】-2 写一个自己的串口

【全志H616】-2 写一个自己的串口 1、基本命令 重启 sudo rebootLinux系统下一个文件夹的文件复制到另一个文件夹下 cp flags.c /home/user05/lab09/flags_revised.c //复制当前文件夹下的 flags.c 文件到 lab09 文件夹下flags_recised.c 文件cp oled_demo.c /home/orangep…

【网络安全】专栏文章索引

为了方便 快速定位 和 便于文章间的相互引用等 作为一个快速准确的导航工具 网络安全 目录&#xff1a; &#xff08;一&#xff09; &#xff08;二&#xff09; &#xff08;三&#xff09; &#xff08;四&#xff09;

苍穹外卖中新增员工的功能是如何实现的?再复习下项目结构

一、Common、Pojo、Server分别都是干啥的&#xff1f; 在一个典型的Java应用程序中&#xff0c;通常会使用模块化的方式来组织代码&#xff0c;以提高代码的可维护性和可扩展性。常见的模块包括Common模块、POJO模块和Server模块&#xff0c;它们通常各自负责不同的功能。 Com…