视频教程移步:https://www.bilibili.com/video/BV1hK4y1d714/?p=4&spm_id_from=pageDriver&vd_source=cc8074e9c81a225f214226065db53d32
P3 第二讲 Stata处理数据全流程(上) P3 - 01:37
内置数据 file example datasets
使用command 编辑命令
sysuse auto, clear
P3 第二讲 Stata处理数据全流程(上) P3 - 03:41
浏览数据 browse
横的是变量 竖的是观测值
红色是字符串 黑色是数字 蓝色是值标签value lable赋值之后方便处理
P3 第二讲 Stata处理数据全流程(上) P3 - 05:45
描述数据 describe
观测值obs 变量数vars 大小size
显示格式 display format 变量标签 variable label 解释变量的含义
P3 第二讲 Stata处理数据全流程(上) P3 - 06:51
查看notes
command 输入notes
P3 第二讲 Stata处理数据全流程(上) P3 - 07:39
呈现数据 summarize
obs观测值若有比其他变量是少的,证明有缺失值(一个极大的数)
准确查看某变量
codebook rep78
类别 numberic 数字型 int整型
range 范围 units单位值 unique values不同的值
missing . 缺失值个数
Freq. 出现的频次 value值 . 表示缺失
P3 第二讲 Stata处理数据全流程(上) P3 - 10:57
只查看缺失值
br if missing (rep78) \ br if rep78 == .
P3 第二讲 Stata处理数据全流程(上) P3 - 12:21
list 列示数据
list rep78 if rep78 == .
不使用 list 时
弹出窗口 表格复杂
使用list
在结果窗口直接展示 直观
【全流程 中】
P4 第二讲 Stata处理数据全流程(中) P4 - 01:45
查看数据 summarize price
详细查看 summarize price, detail
50% 中位数
P4 第二讲 Stata处理数据全流程(中) P4 - 03:30
查看频数分布 tabulate foreign
查看二维变量频数分布 tabulate rep78 foreign
P4 第二讲 Stata处理数据全流程(中) P4 - 06:44
summarize 简写是sum
sum mpg if foreign == 0
前置命令 by
by foreign, sort: sum mpg
mean 表示平均值
P4 第二讲 Stata处理数据全流程(中) P4 - 07:54
假设检验 ttest mpg by (foreign)
分析相关性 correlate mpg weight
弹出来的二乘二表格中 两变量交汇处负值表示负相关(也可以分析多个变量)
按照某变量分类分析相关性
by foreign, sort: correlate mpg weight
P4 第二讲 Stata处理数据全流程(中) P4 - 11:40
twoway (scatter weight length) (lfit weight length)
此处twoway 是画二维图像的命令,每个括号相当于图层, weight 和 length 是变量
scatter是散点图 llift是拟合出来的直线图
twoway (scatter weight length) (lfit weight length), by(foreign) 加入此命令可以分类显示图像
【全流程 下】
没看懂 不知道记啥
【viewer 窗口介绍】
主要功能
浏览帮助文件 help 某命令
(。・・)ノ若没有本地命令,viewer会自动在互联网中搜索来安装命令
类似浏览器的 蓝色链接跳转功能
find 在左下角的↙查找功能
P6 第三讲 Viewer窗口的介绍 P6 - 04:55
log文档的使用
在写命令前,先打开log begin,保存smcl后缀文件
然后进行操作 最后关闭log ,log close
整个log文档操作过程就全部记录在log文档了
而log后缀的文件可以不需要用viewer窗口直接用记事本打开(相当于txt文件)
【数据列示和基本命令语法】
P7 第四讲 数据列示和基本命令语法 P7 - 01:31
数据列示的命令 list 查找用法,help文档
中括号里面的选项可填可不填
list 不接变量时显示所有数据,接几个变量列示几个数据
命令下面的下划线 list 表示最简写的本命令
即 l li lis list 都可以代表命令list
P7 第四讲 数据列示和基本命令语法 P7 - 04:44
搭配通配符
list m* 列示所有m开头的变量
list price-weight 列示price 到weight所有的变量
P7 第四讲 数据列示和基本命令语法 P7 - 05:56
if 与 运算符
list price if (price <= 1000)
list price if (price<4000) & (price >3500)
if help文档中,有运算符介绍
== 等于 != 不等于
& and
P7 第四讲 数据列示和基本命令语法 P7 - 08:59
在有值标签的变量下,if forign == 1 才是对的
因为文字形式只是其描述而真正的值是数字
P7 第四讲 数据列示和基本命令语法 P7 - 09:25
in (一般表示范围)
list price in 1/20 (列出前二十个观测值)
(。・・)ノ若运算量过大,显示more选项,点击more查看更多或输入 set more off 关闭该模式
break按钮 终止运算
【生成新变量】
两个重要命令
generate 生成全新变量(简写为gen)
gen rep78_2 = rep78 ^ 2
gen rep78_2 = sqrt(rep78)
gen不能生成已有函数,对已有的修改需要用下面这个
replace 对原有变量修改
replace model = make in 1/20
注意此处等于号是赋值,把make的观测值赋值给了model
【删除变量和观测值】
clear 删除变量
全部删除 clear all
drop
接变量直接删除该变量以及观测值
接in 1/20 则删除所有变量前二十位(1/20指第一到第二十位)
keep
通过删除其他变量起到保留的作用
使用方法和drop对应
【stata作图】
二维图像 twoway