文章目录
- 语法学习
- 创建数据的方式
- 绘制图形的方式
- 图形添加颜色
- 如何操作数据的方式
- 数据进行验算的
- 判断加付值的方式
- 修改变量名称的方式
- 判断是否存在缺失值
- 在计算的方式忽略缺失值
- 通过函数的方式忽略缺失值
- 日期处理的方式
- 字符串转化成日期的方式
- 格式化数据框中数据
- 返回当前的日期的方式
- 获取月日的方法
- 在日期上进行运算的方式
- 日期转字符串的方式
- 合并俩个数据框的方式
- 查看数据框的方式
- 对数据进行栓选的方式
- 使用数据库查询方式
语法学习
创建数据的方式
dose <- c(20,30,40,50)
drugA <- c(16,29,20,30)
创建了俩个数据我们可以把数据输出一下看一下数据格式
绘制图形的方式
plot(dose,drugA,type="b",lty=3,lwd=3,pch=15,cex=2)
参数含义
type= ”b“ 同时绘制点和线的方式
dose 在x坐标的方式
drugA 在y坐标点方式
lwd = 3 设置线的宽带的方式
cex =1 指定 符号的大小
图形添加颜色
lines(dose,drugA,type = "b",pch=17,lty=2,col="blue")
col=“blue” 添加颜色的方式
lty =1 指定线条的类型
如何操作数据的方式
准备基础数据
manager <- c(1,2,3,4,5)
data <-c("10/20/28","10/20/27","10/20/26","10/20/25","10/20/01")
country <- c("US","UC","UD","UW","UE")
gender <- c("W","N","E","B","L")
age <- c(23,34,64,64,55)
q1 <- c(1,34,5,6,7)
q2 <- c(1,34,5,6,7)
q3 <- c(1,34,5,6,1)
q4 <- c(1,34,5,NA,5)
q5 <- c(1,34,5,NA,8)
# 把数据放入到数据库框中的方式
leadership <- data.frame(manager,
data,
country,gender,age,q1,q2,q3,q4,q5
,stringsAsFactors = FALSE)
数据框中输出的数据信息
数据进行验算的
# 对数据进行运算的方式
sumData <- leadership$q2+leadership$q1
这里需要给q1 和q2 中添加数据才可以
判断加付值的方式
age 等于99 设置为 NA
leadership[leadership$age == 99] <- NA
基本练习
leadership[leadership$age > 75] <- "Elader"
leadership[leadership$age >= 55 & leadership$age <=75] <- "Elader"
leadership[leadership$age < 66] <- "Youd"
修改变量名称的方式
fix(leadership)
弹出一个数据框我们可以直接在上面编辑
我们修改了第二列的名称为tesDate01
names(leadership)[2] <- "testDate01"
判断是否存在缺失值
y <- c(1,2,3,NA)
is.na(y)
true 说明存在缺失值
在计算的方式忽略缺失值
y2 <- sum(y,na.rm =TRUE)
通过函数的方式忽略缺失值
test02 <- na.omit(test01)
日期处理的方式
myDate <- as.Date(c("2003-9-09","2003-9-10"))
字符串转化成日期的方式
dates <- as.Date(strDates,"%m/%d/%Y")
格式化数据框中数据
myformat <- "%/m/%d/%y"
leadership$date <- as.Date(leadership$date,myformat)
返回当前的日期的方式
currentDate <- Sys.Date()
获取月日的方法
x <- format(toDay,"%B %d %y")
在日期上进行运算的方式
startDate <- as.Date("2023-10-10")
endDate <- as.Date("2024-10-10")
days <- endDate - startDate
# 最后计算结果是天数
days
difftime 这个函数计算结果
Date01 <- Sys.Date()
currentDate <- format(Date01,format="%Y-%d-%m")
endDate <- as.Date("2023-10-20")
endDate <- format(endDate,format="%Y-%d-%m")
currentDate
Date01
currentDate
difftime(Date01,endDate,units = weekdays())
日期转字符串的方式
t1 是日期函数
strDates <- as.character(t1)
判断是否是数值的方式
is.numeric(a)
is.vector(a)
合并俩个数据框的方式
merge 合并俩个数据框的方式
total <- merge(name,age)
查看数据框的方式
查看数据库的前三行
newData <- leadership[1:3,]
对数据进行栓选的方式
选择年龄大于18体重大150的
newTestDate <- testData[
testData$age > 18
&
testData$weight > 120,
]
# 将选中的数据放入到体重中的方式
ccc <- subset(
testData,
age > 18 | age < 24,
select = (weight)
)
使用数据库查询方式
install.packages("sqldf")
library(sqldf)
library(gsubfn)
library(proto)
library(RSQLite)
newdf <- sqldf("select * from testData where age =16")
newdf