版权声明:本文为博主原创文章,如需转载请贴上原博文链接:基于Python的量化交易回测框架Backtrader初识记录(一)-CSDN博客
前言:近期以来,对股市数据获取及预处理算是告一段落,下一步就需要利用这些实盘数据进行数据分析并制定策略。本文目的旨在记录在操作Backtrader(正文内容中简称BT)的过程中的思路以及面临新问题的解决方法,并非指导教程,入门教程见第一章《Quick Start》。
在选择Backtrade之前,有查找过目前市场上主流的一些量化交易平台及框架,量化平台比如:米筐、聚宽以及同花顺旗下的SuperMind等,框架比较有名的有:vnpy以及AKfamily中的PyBroker(AKShare就是出自他们家),而首选Backtrader的原因有这几点:
①在本地建立了数据库的情况下能离线运行;
②有详尽的文档说明;
③代码开源且覆盖py2和py3(py2不支持图像展示);
④集成ta-lib金融市场技术分析库;
⑤框架简便清晰,能为日后使用AI进行量化策略研究降低入门门槛;
当然Backtrader也不是没有缺点,比如适用于中低频,高频量化就不太行;而且看到有别的使用者说,数据量过大或者订单数过多会导致回测时间太长,对内存需求太大;还有目前官方GitHub已经一年多未更新了,不知道后续是否能持续维护。
目录
一、Quick Start
二、Backtrader中的数据格式探讨
2.1 BT数据源
2.2 BT中两种数据结构对比
2.2.1 Yahoo数据形式
2.2.2 Pandas数据形式
三、实例“000001.SZ 平安银行”的简单量化策略回测
一、Quick Start
对于快速上手,可参考:从零开始掌握BackTrader量化框架,这一专栏中的五篇文章能迅速帮助建立框架认知,并进行简单的策略操作,同时能展示出股票走势、买卖点指示以及收益情况。
二、Backtrader中的数据形式探讨
目前网络上大多数给出的BT输入的用于回测的数据都是Yahoo的CSV文件(在线或下载下来的csv文件),显然这种方式只适用于针对策略研究,而不适用于选股以及量化操作,毕竟一个一个单独的csv文件加载起来可不是一件高效的事情,更何况Yahoo自2021年11月1日起已经不再给中国大陆提供产品与服务了。
2.1 BT数据源
从官方手册可见,支持多种数据源输入(如图2.1所示),然而并没有找到我想使用的方式,但是看到支持Pandas,那就可以从数据库读取数据了。
2.2 BT中两种数据形式对比
2.2.1 Yahoo数据形式
在Yahoo还能使用的时候,通常可以直接从Yahoo网站上拉取数据,参考:股票OHLC历史数据爬取——Yahoo,查看源码可发现,在yahoo.py文件中的YahooFinanceCSVData类,需要的数据如下:
# path:./backtrader/feeds/yahoo.py
self.lines.datetime[0] = dtnum
self.lines.openinterest[0] = 0.0
self.lines.open[0] = o
self.lines.high[0] = h
self.lines.low[0] = l
self.lines.close[0] = c
self.lines.volume[0] = v
self.lines.adjclose[0] = adjustedclose
其中主要参数读取顺序(自上而下)如下图2.2:
当然,如果数据库中没有adjclose数据(一般前复权/后复权数据需要足够的权限),也可以直接使用`close`的数据替代(当然这样有时候会有些许不准确,或者在构建数据库的时候,close数据直接使用前复权的收盘价);
如图2.3,数据加载之后的顺序有些混乱,暂时还没搞清楚是什么原因导致的,后续再研究。(注:line_7是adjustedclose);
2.2.2 Pandas数据形式
通常处理Dataframe类型的数据就使用Pandas,BT中有和Pandas相关的数据类型,查看源码可发现,在pandafeed.py文件中的PandasData类,需要的数据如下:
# path:./backtrader/feeds/pandafeed.py
params = (
('nocase', True),
('datetime', None),
('open', -1),
('high', -1),
('low', -1),
('close', -1),
('volume', -1),
('openinterest', -1),
)
# 主要参数读取顺序
datafields = [
'datetime', 'open', 'high', 'low', 'close', 'volume', 'openinterest'
]
目前数据库中个股数据来源于Tushare,其column name(如图2.4所示)和PandaData所需的datafields并未对齐,所以从数据库加载的时候可以将多余的字段删除(当然openinterest本身就没有这个字段的数据,也不影响策略回测计算和后续绘图);
采用PandaData方式加载的数据形式如图2.5所示,可见比使用YahooFinanceCSVData方式加载的数据少了一个`adjclose`字段,但如同2.2.1节中所说的,可以直接将前复权/后复权的收盘价存储在`close`字段中;(注:line_6是datetime);
三、实例“000001.SZ 平安银行”的简单量化策略回测
【待更新:A股行情数据获取&量化交易策略的结构设计】
参考资料:
1.Backtrader简介
2.【答读者问3】用backtrader可以做什么?