上一讲已经讲A股的数据下载到本地或保存数据库,我们可以随时使用。
移动平均MA(Moving Average) ,是用统计分析的方法,将一定时期内的证券价格(指数)加以平均,并把不同时间的平均值连接起来,形成一根MA,用以观察证券价格变动趋势的一种技术指标。
下面我们从K 线图中的均线讲解移动平均值,如 5日均线(周),10日均线(半月),20日均线(月),250日均线(年)。在肌市多头排列,空头排列这些专业名称,我在以后讲解都需要用到移动平均值。多头排列,即小周期的均值大于大周期的均值,即小周期均线在大周期均线之上,反之,即空头排列。
除了移动平均之外,加权移动平均(Weighted Moving Average,WMA),指数移动平均值(Exponential Moving AverageEMA),也是类似指标,在股市也有着广泛的应用。
原理
在讲移动平均值前,让我先了解简单平均值:
M
=
1
N
∗
(
X
1
+
X
2
+
⋯
+
X
N
)
=
1
N
∑
i
=
1
N
M=\frac{1}{N}*(X_1+X_2+ \cdots +X_N)=\frac{1}{N} \sum_{i=1}^N
M=N1∗(X1+X2+⋯+XN)=N1i=1∑N
这就是我们平时讲的一般意义的平均值。而移动平均值,给定一个移动窗口,来计算一系列平均值。
我们以百度百科的例子。
原数据列为:
X
1
,
X
2
,
X
3
,
⋯
,
X
n
X_1,X_2,X_3,\cdots,X_n
X1,X2,X3,⋯,Xn 现以窗口长度为 3,进行移动平均值,公式如下:
X
1
+
X
2
+
X
3
3
,
X
2
+
X
3
+
X
4
3
,
⋯
,
X
n
−
2
+
n
n
−
1
+
X
n
3
\frac{X_1+X_2+X_3}{3},\frac{X_2+X_3+X_4}{3},\cdots,\frac{X_{n-2}+n_{n-1}+X_n}{3}
3X1+X2+X3,3X2+X3+X4,⋯,3Xn−2+nn−1+Xn
代码实现
为了方便描述,将数列都放在 pandas 里;
X= np.arange(1,11)
df=pd.DataFrame(X,columns=['A'])
for i in range(3,df.shape[0]):
df.loc[i,'B']=(df.loc[i-3][0]+df.loc[i-2][0]+df.loc[i-1][0])/3
df
A | B | |
---|---|---|
0 | 1 | NaN |
1 | 2 | NaN |
2 | 3 | 2.0 |
3 | 4 | 3.0 |
4 | 5 | 4.0 |
5 | 6 | 5.0 |
6 | 7 | 6.0 |
7 | 8 | 7.0 |
8 | 9 | 8.0 |
9 | 10 | 9.0 |
可以发现B2=(A0+A1+A2)/3
, B3=(A1+A2+A3)/3
, B4=(A2+A3+A4)/3
。由于前面2行个无法计算一般情况下是删除。
弄清楚原理后,pandas 函数和 Ta-lib 库都可以提供相关操作,获得一致结果。
- pandas 函数
# 直接用pandas 的rolling函数
df.A.rolling(window=3).mean()
- ta-lib 库
# talib 的MA 函数
talib.MA(df.A, timeperiod = 3)
这里在安装talib
有个坑,需提醒大家的。
不能直接用命令安装pip install Ta-Lib
,可能会提示安装不成功或错误。
原因是不同的python版本,需要不同的talib库。因此需要自己下载whl格式文件,进行手动安装。
方法如下:
- 找到自己电脑的python 版本 ,具体 命令为‘!python -V’,比如得到的是3.6.4
如:若本机安装是32位的python3.6,则选TA_Lib‑0.4.17‑cp36‑cp36m‑win32.whl下载;
下载地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/
在后面找到“TA-Lib: a wrapper for the TA-LIB Technical Analysis Library.”这一行下面。 - 在命令行中(命令行的打开方式在文章最后的Tips里),进入此whl文件所在的目录,执行命令:
pip install 下载的whl文件名
如:pip install TA_Lib-0.4.17-cp37-cp37m-win_amd64.whl
或pip install 文件所在的绝对路径+文件名
如:pip install D:my_packages TA_Lib-0.4.17-cp37-cp37m-win_amd64.whl
应用
现在以收盘价,画出5日,10日,20日,均线。为了方便我们定义一个函数。
def ma(df, n=5, factor='close'):
"""
计算均线因子
:param df: 待计算扩展因子的DataFrame
:param n: 待计算均线的周期,默认计算5日均线
:param factor: 待计算均线的因子,默认为收盘价
:return: 包含扩展因子的DataFrame
"""
# 均线名称,例如,收盘价的5日均线名称为ma_5,成交量的5日均线名称为volume_ma_5
name = '{}ma_{}'.format('' if 'close' == factor else factor + '_', n)
# 取待计算均线的因子列
s = pd.Series(df[factor], name=name, index=df.index)
# 利用rolling和mean计算均线数据
s = s.rolling(center=False, window=n).mean()
# 将均线数据添加到原始的DataFrame中
df = df.join(s)
# 均线数值保留两位小数
df[name] = df[name].apply(lambda x: round(x + 0.001, 2))
return df
# 均线周期列表
ma_list = [5, 10, 20, 30, 60]
newxx=pd.DataFrame()
newxx['close']=dataframe['close']
for i in ma_list:
newxx=ma(newxx,i)
# 数据太多,就取最后100个进行画图。
newxx[-100:].plot(figsize=(10, 8));
插播一个知识点
在采集到A股数据中有一列 pctChg
,即涨跌幅,也可以通过pandas
的pct_change()
函数 来获得,
dataframe.close.pct_change()
原理即
收
益
当前
=
收盘
价
当前
−
收盘
价
前交易日
收盘
价
前交易日
收益_{当前}=\frac{收盘价_{当前} - 收盘价_{前交易日}}{收盘价_{前交易日}}
收益当前=收盘价前交易日收盘价当前−收盘价前交易日
这个函数,在A股又称收益率,如果带上参数, pct_change(5)可以表示5天的收益率。