3. R获取数据的三种途径、读入文件、写入文件、读写excel文件、读写R文件

news2024/11/19 7:46:09

课程视频链接:https://www.bilibili.com/video/BV19x411X7C6?p=1
本笔记参照该视频,笔记顺序做了些调整【个人感觉逻辑顺畅】,并删掉一些不重要的内容
系列笔记目录【持续更新】:https://blog.csdn.net/weixin_42214698/category_11393896.html

文章目录

  • 1.R获取数据的三种途径
    • 1.1 键盘输入数据
    • 1.2 读取存储在外部文件上的数据
    • 1.3 访问数据库系统获取数据
  • 2.读入文件
    • 2.1 读取本地文件 read.table()
    • 2.2 读取剪贴板
  • 3.写入文件 write.table()
  • 4.读取 和 写入Excel文件
    • 4.1 —————— XLConnect包
    • 4.2 —————— xlsx包
  • 5.读写R格式文件

1.R获取数据的三种途径

1️⃣利用键盘来输入数据;
2️⃣通过读取存储在外部文件上的数据
3️⃣通过访问数据库系统来获取数据。

例如有以下数据:
在这里插入图片描述

1.1 键盘输入数据

方式一:

> patientID <- c(1, 2, 3, 4)
> admdate <- c("10/15/2009","11/01/2009","10/21/2009","10/28/2009")
> age <- c(25, 34, 28, 52)
> diabetes <- c("Type1", "Type2", "Type1", "Type1")
> status <- c("Poor", "Improved", "Excellent", "Poor")
> data <- data.frame(patientID, age, diabetes, status)
> data
  patientID age diabetes    status
1         1  25    Type1      Poor
2         2  34    Type2  Improved
3         3  28    Type1 Excellent
4         4  52    Type1      Poor
> 

方式二:【通过edit( )来输入数据】

data2 <- data.frame(patientID=character(0), age=numeric(0),
                    diabetes=character(), status=character())
data2 <- edit(data2)

调用后会显示一个数据编辑器,可以直接在编辑器里输入数据,结果会保存在data2中:
在这里插入图片描述
再调用fix(data2),可以继续进行数据修改。

1.2 读取存储在外部文件上的数据

利用R读取的文件,最好是经过处理的适合R使用的文件。
数据需要进行大量的预处理,最好先利用python进行统计,再将统计结果导入到R软件中进行分析。
具体访问方法在之后会详细讲到。

1.3 访问数据库系统获取数据

通过ODBC访问数据库。ODBC是开放数据库连接Open DataBase Connectivity的简称。
在R中可以通过RODBC包来连接和访问数据库。

install.packages(“RODBC”)  
library(RODBC)
help(package="RODBC")



2.读入文件

2.1 读取本地文件 read.table()

read.table(file , sep , header , skip, nrows, na.strings , stringsAsFactors)

\- file为读取的文件名; 【可以是绝对路径 or 相对路径】
\- sep为文件分隔符;  【默认为空白】
\- 若文件头部为变量名称,则header为TRUE; 【重点,为true时第一行不是数据,而且列名】 

\- skip为跳过文件中某部分内容;  【从第一行开始跳,skip=n ——>表示1~n不用读取】
\- nrows设置读取文件行数;  

\- na.strings:告诉read.table函数哪部分属于缺失值,read.table函数将这部分替换为NA;  
\-stringsAsFactors:R在读取文件时,数字会默认都读取为数值型,但字符串会默认读取为因子类型,
                   若不需要将字符串读取为因子类型,则可设置为FALSE;  
\- ……  

如:
x <- read.table (“input.csv”) 错误
x <- read.table (“input.csv”,sep=“,”) 正确
x <- read.table (“input.csv”,sep=“,”,header = T) 正确 ,第一行为列名

x <- read.table(“input.csv”,sep=“,”,header=TRUE,skip=50,nrows=200):
读取文件input.csv,文件内容以逗号分隔,若文件头部为变量名称,则header为TRUE,读取文件第51行至250行。

head(x , n=10):截取文件头部十行。n默认是六行。
tail(x , n=10):截取文件尾部十行。n默认是六行。
readLines(“input.csv”,n=5):可以直接读取文件中的行数。

read.csv(“input.csv”):直接读取csv文件,默认分隔符为逗号
read.delim():默认分隔符为制表符。

2.2 读取剪贴板

读取系统剪切板上的数据:
x <- read.table(“clipboard” ,seq=“…”)
or x <- readClipboard()


不推荐直接读取网络上的文件 或 直接读取压缩文件



3.写入文件 write.table()

write函数与cat函数类似,只不过cat函数是将数据显示在屏幕上,而write则是写到文件里面。
如:
x <- rivers
write(x,file=“x.txt”)
如果对象是一个数据框,可以使用write.table函数,如果是写入到csv文件,则可以使用write.csv文件。

write.table(x , file , sep , row.names , quote ,append , na)

\- x是需要写入的数据;  
\- file是写入的文件,若没有目录,则默认写在当前工作目录下;  
\- sep是指定的数据分隔符;  
\- 若不需要每次数据写入文件时加上序号,则设置row.names为FALSE;  
\- 默认情况下,write函数会为字符串添加双引号,若不需要,则可设置quote为FALSE;  

\- append参数将文件内容写入相同文件名的文件中,TRUE表示追加到文件结尾,FALSE则表示清空原文件内容再写入;  
\- na参数代表设置缺失值为NA;  

注意:若写入文件是csv,则分隔符最好是逗号,可以将一个数据分为一个单元格。

不推荐:
R不仅支持直接读取压缩文件,也支持直接写成压缩文件。
如: write.table(mtcars,gzfile(“newfile.txt.gz”))
表示将文件压缩为gz格式的压缩包。



4.读取 和 写入Excel文件

简单方法:
1️⃣- 将excel文件转为csv文件读取;
2️⃣- 将excel文件数据内容复制到剪切板中读取。

但是当Excel文件过多时,上面的简单方法用起来就比较麻烦了。R中包含许多直接读取Excel文件的包。

4.1 —————— XLConnect包

XLConnect包:需要配置java的运行环境。

install.packages("XLConnect")   # 安装包
library(XLConnect)   # 导入包,就可以使用

读文件:
1)两步
ex <- loadWorkbook(“data.xlsx”)
edata <- readWorksheet(ex,1) # 表示读取ex表格中的第一个工作表
edata <- readWorksheet(ex,1,startRow=0,startCol=0,endRow=50,endCol=3)

2)一步
readWorksheetFromFile (“data.xlsx”,1,startRow=0,startCol=0, endRow=50,endCol=3,header=TRUE)

写文件:
1)四步
wb <- loadWorkbook(“file.xlsx”,create=T) #创建工作簿
createSheet(wb,“Sheet 1”) #创建工作表sheet1
writeWorksheet(wb,data=mtcars,sheet=“Sheet 1”) #写数据
saveWorkbook(wb) #将工作簿保存为文件

2)一步
writeWorksheetToFile(“file.xlsx”,data=mtcars,sheet=“Sheet 1”)

4.2 —————— xlsx包

install.packages("xlsx")
library(xlsx)

读文件:
x <- read.xlsx(“data.xlsx”,1) #表示读取表格中的sheet1工作表

写文件:
write.xlsx(x,file=“data.xlsx”,sheetName=“Sheet 1”,append=F) #将数据写入表格Sheet1中


5.读写R格式文件

存储为R文件会有很多优势:
R会对存储为内部文件格式的数据进行自动压缩处理,并且会存储所有与待存储对象相关的R元数据。
如果数据中包含了因子、日期和时间或者类的属性等信息,存储为R文件则更加实用。

R格式的文件有两种:RDS 和 RData。
(1) .RDS文件

# iris为内置数据集
saveRDS(iris,file="iris.RDS")

rdsdata <- readRDS("iris.RDS")

(2).RData文件(更复杂,整个项目文件)

> save(iris,iris3,file="iris.Rdata")  
> 
> load("iris.Rdata")

> save.image()  【保存所有】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/147952.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

后端人眼中的Vue(三)

五、高级 5.1、计算 5.1.1、computed ​ 在之前的购物车的案例当中&#xff0c;我们已经实现了购物车价格的计算&#xff0c;但是有些时候我们需要在其他很多地方也展示价格&#xff0c;所以每展示一次&#xff0c;我们就需要调用一次计算价格的方法&#xff0c;所以Vue给了…

OV7670 摄像头模块介绍

OV7670摄像头模块简介OV7670是OV&#xff08;OmniVision&#xff09;公司生产的一颗1/6寸的CMOSVGA图像传感器。该传感器体积小、工作电压低&#xff0c;提供单片VGA摄像头和影像处理器的所有功能。通过SCCB总线控制&#xff0c;可以输出整帧、子采样、取窗口等方式的各种分辨率…

Visio 学习笔记 —— Visio 的键盘快捷方式

Visio 学习笔记 —— Visio 的键盘快捷方式常用热键常用对话框文本操作快速访问工具栏参考资料常用热键 操作热键指针工具Ctrl 1文本工具Ctrl 2连接线Ctrl 3连接点工具Ctrl Shift 1裁剪工具Ctrl Shift 2文本块工具Ctrl Shift 4组合所选的形状Ctrl G解散组合Ctrl Sh…

Verilog语法笔记(夏宇闻第三版)-结构说明语句

目录 initial语句&#xff1a; always语句&#xff1a; task和function说明语句&#xff1a; task和function说明语句的不同点&#xff1a; task说明语句&#xff1a; function说明语句&#xff1a; Verilog语言中的任何过程模块都从属于以下四种结构的说明语句&#xff…

【GNN】图基本知识代码、nxworks包的基本使用

一个写得很好的博客&#xff1a; 图或网络中的中心性&#xff1a;点度中心性、中介中心性、接近中心性、特征向量中心性、PageRank 特征向量中心性&#xff08;eigenvector centrality&#xff09; 特征向量中心性的基本思想是&#xff0c;一个节点的中心性是相邻节点中心性的函…

Reactive思考

最近在学习响应式编程&#xff0c;由此翻看了很多资料&#xff0c;在此把思考过程记录下 目录 来由 规范 具体实现 历史 1. Servlet的尝试 1.1 Async实现demo 2. web应用层 2.1 web-flux 2.2 web-flux/web-mvc 与 spring-web架构关系 3. DBConnection层 相关可能混淆…

STL中vector怎么扩容

STL vector扩容 vector容器 vector被称为向量容器&#xff0c;该容器擅长在尾部插入或删除元素&#xff0c;时间复杂度为O(1)&#xff1b;而对于在vector容器头部或者中部插入或删除元素&#xff0c;则花费时间要长一些&#xff08;移动元素需要耗费时间&#xff09;&#xf…

十九、Kubernetes中Pod调度第一篇

1、概述 在默认情况下&#xff0c;一个Pod在哪个Node节点上运行&#xff0c;是由Scheduler组件采用相应的算法计算出来的&#xff0c;这个过程是不受人工控制的。但是在实际使用中&#xff0c;这并不满足的需求&#xff0c;因为很多情况下&#xff0c;我们想控制某些Pod到达某些…

Gradle学习笔记之插件

文章目录插件的作用插件的分类和使用脚本插件对象插件第三方插件用户自定义插件buildSrc项目编写步骤其他项目/模块引用步骤java插件常用属性插件的作用 插件可以帮助我们促进代码的重用、项目更高程度的模块化、自动化和便捷化&#xff0c;减少功能类似代码的编写&#xff0c…

【数据结构与算法】 | 用队列实现栈

用队列实现栈 链接&#xff1a; https://leetcode.cn/problems/implement-stack-using-queues/ 1. 要求 2. 思路 栈的性质是先进后出&#xff0c;队列的性质是先进先出。 题目要求是用两个队列来完成栈的实现&#xff0c;那么大思路就是通过倒腾数据来完成。 3. 代码实现…

JAVA系列 多线程 Thread类 耦合 线程调度 如何创建线程 弱耦合 完全解耦 思维结构整理

这估计是我JAVA系列 基础知识点梳理的最后一篇文章了吧 之后一段时间 我打算去看看之前承诺更新的JAVA的一些项目了 然后我要好好玩一段时间游戏 然后跟某些好朋友见面 所以后面会忙一点 然后就是很多同学 六级还没有考 估计很多人是开学再考把 这个假期就不要玩的太厉害了 没事…

人员超员识别系统 yolov5

人员超员识别系统通过yolov5深度学习网络模型对现场画面进行实时监测&#xff0c;监测到画面中区域人数超过规定人数时&#xff0c;立即抓拍存档预警。YOLO系列算法是一类典型的one-stage目标检测算法&#xff0c;其利用anchor box将分类与目标定位的回归问题结合起来&#xff…

一篇彻底解决:Fatal error compiling: 无效的目标发行版: 11 -> [Help 1]

先在这声明,如果我的方法没有解决你的问题,那你直接私信我,我第一时间帮你解决,送佛送到西!!! 这个问题&#xff0c;主要原因就是JDK的版本问题&#xff0c;“无效的目标发行版&#xff1a;11”的意思是你在某个位置配置了JDK11&#xff0c;但是在其他位置配置的并不是11&…

靶机测试Gears of War笔记

靶机介绍Its a CTF machine that deals with the history of gears of war, where we must try to escape from prison and obtain root privileges. it has some rabbit holes, so you have to try to connect the tracks to get access.This works better with VirtualBox ra…

[ 数据结构 ] 二叉树详解--------前序、中序、后序、存储、线索化

0 前言 why?为什么需要树结构? 数组虽然查找快(通过下标访问),但无法动态扩容(拷贝到新的数组),而链表相反,树结构刚好结合两者优点 浅谈树? 树的存储和读取效率都很高,比如二叉排序树,理解树的抽象模型有助于理解递归的原理,树的模型接近于单向链表,父节点指向左右子树,而…

【因果发现】 针对时序数据的因果图学习

文章目录 一、任务二、数据集说明三、专业名词CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 一、任务 This track focuses on solving a causal structure learning problem in AIOps. AIOps 相关:主要目标是从事件序列数据中挖掘因果图关系,并辅助定位根因。 主要需要解…

php学习笔记-php数组的创建和使用,数组常用函数-day03

php数组的创建和使用&#xff0c;数组常用函数数组的概念一维数组的创建和使用1.直接将变量声明为数组元素2.通过array()函数来创建一维数组3.数组的元素值的访问4.数组元素的赋值方式5.数组的注意事项二维数组的创建和使用1.二维数组的创建2.二维数组的数组元素值访问3.二维元…

ArcGIS基础实验操作100例--实验67设置标注样式

本实验专栏参考自汤国安教授《地理信息系统基础实验操作100例》一书 实验平台&#xff1a;ArcGIS 10.6 实验数据&#xff1a;请访问实验1&#xff08;传送门&#xff09; 高级编辑篇--实验67 设置标注样式 目录 一、实验背景 二、实验数据 三、实验步骤 &#xff08;1&…

Java+Swing可视化图像处理软件

JavaSwing可视化图像处理软件一、系统介绍二、功能展示1.图片裁剪2.图片缩放3.图片旋转4.图像灰度处理5.图像变形6.图像扭曲7.图像移动三、项目相关3.1 乱码问题3.2 如何将GBK编码系统修改为UTF-8编码的系统&#xff1f;四、其它1.其他系统实现2.获取源码一、系统介绍 该系统实…

Allegro174版本新功能介绍之和172版本兼容设置

Allegro174版本新功能介绍之和172版本兼容设置 Allegro升级到了174版本的时候,如果按照常规操作用174版本保存PCB之后,用172版本是无法打开的。 但是174版本开放了一个和172版本兼容的窗口,即便是174版本保存了PCB,172同样还是能够打开 具体操作如下 选择Setup选择User p…