描述统计
分类数据与顺序数据的图表展示
为了下面代码便于看出颜色参数所对应的值,在这里先集中介绍,
col=1是黑色,2是粉红,3是绿色,4是天蓝,5是浅蓝,6是紫红,7是黄色,8是灰色
col= "#AC5500BB " 为十六进制表达颜色
- 频数分布表
> table(x$region) #频数分布
东部 西部 中部
16 17 15
> prop.table(table(x$region)) #频率分布
东部 西部 中部
0.3333333 0.3541667 0.3125000
> table(x$gender,x$region) #列联表:两个及以上变量的频数分布表
东部 西部 中部
男 6 13 6
女 10 4 9
> income_c<-cut(head(x,10)$income,breaks=c(0,30,50,200),labels=c("低收入","中等收入","高收入"))
#将收入前10行中,0~30~50~200,分成低收入、中等收入、高收入
> ftable(head(x,10)$gender,head(x,10)$region,income_c) #三维频数分布表
income_c 低收入 中等收入 高收入
男 东部 1 0 0
西部 2 1 0
中部 2 0 0
女 东部 1 0 0
西部 0 0 0
中部 0 2 1
- 图形的输出
>png("图1.png")
>boxplot( ) #第二步进行画图
>dev.off( ) #第三步就保存在了工作目录里
或>png("图1.png",height=600,width=600) #设置高度与宽度
或>png("图1.png",height=4,width=4,units="in") # units="in"单位是英寸
或>png("图1.png",res=600) #res=600是分辨率
>pdf("图1.pdf") #也可以保存成pdf文件
- 简单条形图
> x<-read.csv("ug.csv",header=T)
> par(mfrow=c(2,2),,bg="white") #把画图区域划分为2行2列,bg是背景颜色
> barplot(sort(table(x$region),decreasing=T),ylab="频数",
+ xlab="地区",col=c(2,7,4),main="地区分布条形图",
+ sub="简单条形图",ylim=c(0,20))
# ylab是y轴标签, xlab是x轴标签,decreasing=T是降序,main是主标题,sub是下标题,col是颜色
- 复式条形图
> barplot(table(x$gender,x$region),legend.text=levels(factor(x$gender)),
+ col=c(2,4),sub="复式条形图",ylab="频数",xlab="地区",beside=F)
# beside=F是分段式条形图
> barplot(table(x$gender,x$region),legend.text=levels(factor(x$gender)),
+ col=c(2,4),sub="复式条形图",ylab="频数",xlab="地区",beside=T)
# beside=T是并列式条形图
> barplot(by(x$height,x$gender,mean),ylim=c(0,200),col=2:3)
- 饼图
> pie(table(x$饮料类型),col=c(2,3,4,5,6),radius=2,
+ main="不同饮料类型构成的饼图",sub="数据来源")
# radius=2是半径大小,main是主标题,sub是下标题,col是颜色