一、stata软件介绍
Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。操作灵活、简单,易学易用。
作者觉得stata软件和python很像,但stata软件既有界面操作又可以编码格式,对新手比较友好。
stata同样需要安装第三方库,以fuzzydid库为例,命令为
ssc install fuzzydid
二、优势和特点
- 可以通过界面点击操作复制日志到编程界面,对操作进行记录和保存
- 导入数据多样化,stata支持excel数据等多种数据
三、导入时的基本操作(以excel为例)
选择对应格式后
在此处点击将第一行作为变量名进行数据的分析,如果选择第二个选项,在做数据分析时,可能会报错。
四、代码和操作
import excel "C:\Users\WL\Desktop\新建文件夹\教育消费.xlsx", sheet("人均支出") firstrow
graph box hie resident_canget students_num teacher_num school_num, title(异常值的检测)
graph export "C:\Users\WL\Desktop\新建文件夹\异常值检测.png", as(png) name("Graph")
asdoc inspect hie resident_canget students_num teacher_num school_num
misstable sum
duplicates list
gen dt=0
replace dt=1 if year>2015
replace dt=0 if year<=2015
twoway (line hie year) (line resident_canget year) (line students_num year) (line teacher_num year) (line school_num year), title(各个变量随年份的变化)
graph export "C:\Users\WL\Desktop\新建文件夹\各个变量随年份的变化.png", as(png) name("Graph")
twoway (scatter resident_canget year), title(城镇居民可支配收入随时间的变化)
graph export "C:\Users\WL\Desktop\新建文件夹\可支配收入的变化.png", as(png) name("Graph")
corr hie resident_canget students_num teacher_num school_num dt
asdoc anova hie c.resident_canget c.students_num c.teacher_num c.school_num dt
asdoc ttest hie,by(dt)
twoway (line resident_canget year), title(城镇居民可支配收入随时间的变化)
graph export "C:\Users\WL\Desktop\新建文件夹\可支配收入折线图.png", as(png) name("Graph")
此代码进行的操作有:
- 缺失值、异常值检验
- 数据可视化
- t检验
- 相关性的计算
- 等等
五、结语
需要excel数据的可以私我哦,和莫小凡一起进步吧!!