文章目录
一、为什么要学stata
- 对经济统计、计量比较友好,经济学读博必备、必会
- 窗口菜单和代码完成一定的功能,简单
- 上手简单
- 可靠性强-这里指的是权威性
- 模型种类丰富-类似R包、python模块
二、软件基本解释
1.软件界面
- 注意历史窗口,红色表示报错哦
2.导入示例数据
输入summarize price
,有时候可简写为sum price
3.认识几个重要的功能符号
- 1.保存日志
- 2.帮助文档
- 3.绘图编辑
- 4.生成do-file文档
- 5.数据编辑
- 6.数据浏览
三、数据的基本观测
describe
返回数据的基本情况,如右下角属性窗口
语法:describe [变量]
,或者不加,注意[]
表示可以加可不加
例子:describe, price
count
查看观测变量个数,可以加逻辑判断
语法:count if [变量]>80
,或者不加
例子:describe if price>500
\describe if missing(rep78)
isid
类似于索引,独特的区分出每一个观测值
语法:isid 变量
例子:isid price
,如果报错,这说明不可以独立区分出每一个观测值,这里说明,每个观测值可能存在重复值unique
语法:unique 变量
找唯一
例子:unique mpg weight
四、统计性描述
1.codebook 数据字典使用
可以用于查看数据类型、简单统计量、缺失值、异常值
codebook [] [] [] [,options]
[]
:代表不是必须的
varlist
:变量名单
if
:逻辑判断
in
:第几个到第几个观测值
options
:跟在逗号后面,一些自定义选项
l
last
f
first
2.summarize
Skewness
:偏度
Kurtosis
:峰度
五、图像初步探索
1.histogram 直方图
histogram varname[if] [] [] [,[continuous_opts | discrrte_opts]options]
注意这里的varname是个单独变量
语法:
hist varname
朴素的图
hist varname, freq bin(5) normal
连续的 如果离散的discrete
hist varname, by(varname2)
分组
2.graph box /hbox 箱线图
graph box var
hbox
表示横向的直方图
graph box pirce, over(foreign)
分组的直方图
3.vioplot小提琴图
一般情况下,小提琴图比箱线图更好,因为可以看到每一个分位下,数据的观测值数量
语法和图像展示