目录
4.1 经济/金融数据库
4.1.1 金融数据与数据库
4.1.2 国外金融数据库概况
4.1.3 国内金融数据库概况
4.1.4 数据的主要内容
4.2 数据格式
4.3 数据的导入
4.3.1 从控制台上输入数据
4.3.2 上市公司财务报表信息读取
4.4 [数据的预处理]
4.1.1 时序数据的预处理
4.1.2 截面数据的预处理[略]
4.1 经济/金融数据库
4.1.1 金融数据与数据库
R
包:
RBloomberg
和
IBrokers
有偿
tseries
和
quantmod
美联储
www.stlouisfed.org
,
Yahoo
财经
finance.yahoo.com
4.1.2 国外金融数据库概况
美国彭博社(收费
)
加拿大汤森路透
www.datastream.com
4.1.3 国内金融数据库概况
万得
Wind
www.wind.com.cn
(实验室排队预约)
北京瑞思
www.resset.cn
深圳国泰安
www.gtarsc.com
巨潮
www.cninfo.com.cn
聚源
www.gildata.com
财汇
www.finchina.com
4.1.4 数据的主要内容
国泰安为例:公司财务报表(
1990
年来所有
AB
古上市公司的季报,半年报,年报)、股票(基本
资料和全部交易数据)、债券、基金(投资组合,净值,主要财务指标)
4.2 数据格式
4.3 数据的导入
4.3.1 从控制台上输入数据
4.3.2 上市公司财务报表信息读取
1.
运用剪贴板
read.delim('clipboard')
2.
转换格式,再调用
read.scv()
或者
read.txt()
(
或者
read.table()
读取
txt
文本文件)
3.
股票数据在线读取
补充:股票价格的信息:
OHLC
一般
“A
股股票
4. 读取外部数据源
4.4 [数据的预处理]
4.1.1 时序数据的预处理
1.
数据合并:包
merge.xts()
2.
子集选择:
变量选取
,直接用
“
变量名
”
,从数据框中选取;
样本选取
,根据逻辑条件用
subset()
函数
3.
随机抽样:
sample()
4.
数据补齐:缺失值可以用
na.approx()
补齐;时序数据可用
align()
函数
5.
频率转换:高频转低频
to.monthly()
;低频转高频(有数据失真风险)
6.
滚动窗操作
提取中国A股个股信息:只知道股票代码,不知道股票简称
非联网环境可以用xlsx读入,但此时的数据类型是dataframe
4.1.2 截面数据的预处理[略]