量化交易backtrader实践(四)_评价统计篇(3)_更多评价与可视化

news2024/11/23 16:43:36

前情回顾

在第(1)节中,我们对于backtrader内置的评价指标一个接一个的进行了实践测试,其中第10个是金融投资组合分析库 - pyfolio,当时我们先去实践了Analyzer中的pyfolio指标(其实就是03,07,08,09四个评价指标的合集),也说到后续再去研究pyfolio库和quantstats库的使用。

这一节,我们就来做这件事情。

A_pyfolio实践

 01_backtrader官方文档学习

  • Analyzers - PyFolio - Backtrader
  • Analyzers - PyFolio - Integration - Backtrader

上面2个页面就是backtrader关于Analyzers-PyFolio的官方文档说明,这里面最有意思的几句话我们用AI把它翻译过来

截至2017年7月25日,pyfolio的API已经发生了变化,create_full_tear_sheet函数不再接受名为gross_lev的参数。

因此,如果原来的代码中使用了gross_lev参数,它将无法正常工作,因为该参数不再存在。

由于上述变化,集成示例中的代码不再工作。

Backtrader在集成一个名为 pyfolio 的投资组合工具时,遇到了一些挑战,但也取得了一些进展。主要的障碍在于正确设置所需的依赖项。这在软件开发中很常见,尤其是在集成外部库时。

总的来说,将 pyfolio 与 Backtrader 集成是一个复杂的过程,涉及到管理依赖项、确保跨不同操作系统的兼容性,并进行彻底的测试。然而,有了正确的工具和资源,就可以克服这些挑战,创建一个强大的投资组合分析工具。

这里感觉就是跟pyfolio之间配合的不太好的意思,所以在这样的背景下,我们不会花费太多的精力在这个上面,不过该学习和实践的流程还是需要走的。

使用方法 usage

在第1个页面上有使用方法(usage)

  1. Add the PyFolio analyzer to the cerebro mix:

    cerebro.addanalyzer(bt.analyzers.PyFolio)
    
  2. Run and retrieve the 1st strategy:

    strats = cerebro.run()
    strat0 = strats[0]
    
  3. Retrieve the analyzer using whatever name you gave to it or the default name it will be given to it: pyfolio. For example:

    pyfolio = strats.analyzers.getbyname('pyfolio')
    
  4. Use the analyzer method get_pf_items to retrieve the 4 components later needed for pyfolio:

    returns, positions, transactions, gross_lev = pyfoliozer.get_pf_items()
    

    !!! note

    The integration was done looking at test samples available with
    `pyfolio` and the same headers (or absence of) has been replicated
    
  5. Work with pyfolio (this is already outside of the backtrader ecosystem)

02_实践过程

_关于pyfolio库的安装

参考文档:

  • Backtrader快速入门——3. 使用pyfolio进行可视化分析-CSDN博客
  • pyfolio工具结合backtrader分析量化策略组合,附源码+问题分析-CSDN博客
  • empyrical、pyfolio工具介绍及在backtrader量化框架中使用-CSDN博客

首先,已经安装了backtrader的是否还需要安装pyfolio?这个第一个让我疑惑的问题,因为很明显的backtrader里Analyzer中就有pyfolio嘛。

验证它也非常简单,在notebook里直接

import pyfolio as pf

然后就得到一个错误反馈

ModuleNotFoundError: No module named 'pyfolio'

 这样就明白了,pyfolio是没有安装的,所以Analyzer中的pyfolio与pyfolio库本质上是二件事。

从参考文档上得到的信息是:直接install会报各式各样的错误,要用git拉开发版,但我在看到这些之前已经按下了按钮,所幸安装是成功了。

pip install pyfolio

_第一部分的实践

根据官方文档以及参考文档,在使用pyfolio的时候,我们需要添加一些语句,我们先人为把它分成2个部分,先来看第一个部分的代码:

cerebro = bt.Cerebro()
#......

cerebro.addanalyzer(bt.analyzers.PyFolio, _name='_PyFolio')  # 加入pyfolio分析者
#......

result = cerebro.run()     # 运行

strat = result[0]
pyfoliozer = strat.analyzers.getbyname('_PyFolio')
returns, positions, transactions, gross_lev = pyfoliozer.get_pf_items()
print(transactions)

                                 amount  price  sid  symbol         value
date                                                                     
2023-03-23 00:00:00+00:00   9779.951100   4.09    0  601086 -40000.000000
2023-04-07 00:00:00+00:00  -9779.951100   3.89    0  601086  38044.009780
2023-05-04 00:00:00+00:00  10454.333757   3.75    0  601086 -39203.751589
2023-05-25 00:00:00+00:00 -10454.333757   4.37    0  601086  45685.438519
2023-06-07 00:00:00+00:00   8289.781377   5.04    0  601086 -41780.498138
2023-06-14 00:00:00+00:00  -8289.781377   4.42    0  601086  36640.833685
2023-07-11 00:00:00+00:00   8943.925785   4.44    0  601086 -39711.030483
2023-08-10 00:00:00+00:00  -8943.925785   6.27    0  601086  56078.414669
2023-09-28 00:00:00+00:00   8531.200243   5.42    0  601086 -46239.105319
2023-10-11 00:00:00+00:00  -8531.200243   5.27    0  601086  44959.425283
2023-10-26 00:00:00+00:00   8945.390516   5.11    0  601086 -45710.945537
2023-12-06 00:00:00+00:00  -8945.390516   5.39    0  601086  48215.654882
2024-01-05 00:00:00+00:00   8810.504154   5.30    0  601086 -46695.672016
2024-01-22 00:00:00+00:00  -8810.504154   5.25    0  601086  46255.146808
2024-02-26 00:00:00+00:00  11369.871599   4.09    0  601086 -46502.774838
2024-04-03 00:00:00+00:00 -11369.871599   4.74    0  601086  53893.191377
2024-04-09 00:00:00+00:00   9694.143360   5.10    0  601086 -49440.131138
2024-04-17 00:00:00+00:00  -9694.143360   4.37    0  601086  42363.406485
2024-05-09 00:00:00+00:00  10085.200068   4.62    0  601086 -46593.624312
2024-05-15 00:00:00+00:00 -10085.200068   4.50    0  601086  45383.400304
2024-06-17 00:00:00+00:00  11788.516590   3.91    0  601086 -46093.099867

 有没有发现这里出来的东西感觉很熟悉?是不是在哪刚刚见过?我们从第(1)节的09_交易记录Transactions的输出再看一下

Date: 2023-03-23 00:00:00
[9779.9511002445, 4.09, 0, '601086', -40000.0]
  Amount: 9779.9511002445, Price: 4.09, Sid: 0, Symbol: 601086, Value: -40000.0
Date: 2023-04-07 00:00:00
[-9779.9511002445, 3.89, 0, '601086', 38044.009779951106]
  Amount: -9779.9511002445, Price: 3.89, Sid: 0, Symbol: 601086, Value: 38044.009779951106

......

所以,这部分的功能就是前面我们已经实践过的,只不过它用了一个函数 get_pf_items()把4个评价指标都做成了pandas的格式,而前面我们仅仅是使用函数get_analysis()获取整个对象。

所以,我们也可以像前面一样,把这些东西写到我们的函数里去

def add_analyzer_all(cerebro):
#    cerebro.addanalyzer(bt.analyzers.TimeReturn, _name='pnl') # 返回收益率时序数据
    cerebro.addanalyzer(bt.analyzers.PyFolio, _name='_PyFolio')
  
    
def analyzer_output(result):

     print('---------Pyfolio________________')
     rets,pos,trans,level = result.analyzers._PyFolio.get_pf_items()
     print(trans)

然后输出的结果跟前面的是一样的。

第一部分的实践小结:

  1. 第一部分本质上还是添加了bt.analyzers.PyFolio这个内置的评价指标
  2. 在数据的格式上,并没有使用get_analysis()来获取,而是使用.get_pf_items()得到4个pandas的数据,分别赋给 returns, positions, transaction 和 gross_level了

_第二部分的实践

第二部分,见官方文档 Analyzers-PyFolio的 Sample Code部分中 pyfolio showtime的内容

# pyfolio showtime
import pyfolio as pf
pf.create_full_tear_sheet(
    returns,
    positions=positions,
    transactions=transactions,
    gross_lev=gross_lev,
    live_start_date='2005-05-01',  # This date is sample specific
    round_trips=True)

# At this point tables and chart will show up

看上去,只是运行了create_full_tear_sheet()这个函数,然后表格和图就会显示出来?从这个方向理解的话,pyfolio是不是一个画表格画图的库?然后我们需要的得到一些评价指标的计算在哪里?

pyfolio源码查询

任意新开一个py文件,输入 import pyfolio ,然后点击pyfolio跳转到__init__.py文件

#  pyfolio\__init__.py

from . import utils
from . import timeseries
from . import pos
from . import txn
from . import interesting_periods
from . import capacity
from . import round_trips
from . import risk
from . import perf_attrib

from .tears import *  # noqa
from .plotting import *  # noqa
from ._version import get_versions

放到AI里去得到解析如下

  1. from . import utils

    utils子模块。可能包含一些通用的实用函数,如数据处理、字符串操作等。
  2. from . import timeseries

    timeseries子模块。可能提供了与时间序列分析相关的功能,如计算时间序列数据的各种统计指标。
  3. from . import pos

    pos子模块。可能与投资组合的持仓相关,可能包括持仓分析、持仓调整等功能。
  4. from . import txn

    txn子模块。可能与交易相关,可能包括交易分析、交易成本计算等功能。
  5. from . import interesting_periods

    interesting_periods子模块。可能与投资组合的关键时期相关,如牛市、熊市等,可能提供这些时期的识别和分析功能。
  6. from . import capacity

    capacity子模块。可能与投资组合的容量相关,包括容量限制、调整等功能。
  7. from . import round_trips

    round_trips子模块。这个子模块可能与投资组合的循环交易相关,提供循环交易的识别和分析功能。
  8. from . import risk

    risk子模块。可能与投资组合的风险相关,包括风险度量、风险管理等功能。
  9. from . import perf_attrib

    perf_attrib子模块。可能与投资组合的表现归因相关。
  10. from .tears import *

    tears子模块。包含与可视化相关的功能,用于创建各种投资组合表现报告。
  11. from .plotting import *

    plotting子模块。包含与数据可视化相关的功能,用于创建各种图表和图形。
  12. from ._version import get_versions

    _version子模块中的get_versions函数。用于获取模块的版本信息。

初步看起来,估计与 utils, pref_*, tears这些模块会有些关系~

接着,我们看示例代码中使用的函数create_full_tear_sheet(),点击它会跳转到tears.py中,同上我们把函数的解释部分交给AI,得到一系列的解析:

这段代码定义了一个名为 create_full_tear_sheet 的函数,它是 pyfolio 库的一部分,用于生成一系列投资组合表现分析报告。以下是对函数参数的解析:

returns: 策略的每日非累积回报率,是日期时间索引的Pandas Series。

positions: 每日净持仓价值,是日期时间索引的Pandas DataFrame,包含持仓和现金。

transactions: 执行的交易量与成交价格,是日期时间索引的Pandas DataFrame,每一行代表一次交易。

......

set_context: 是否设置默认的绘图风格上下文。

factor_partitions: 指定因子应该如何在绩效归因、因子回报率和风险暴露图中分离的映射。

该函数的主要目的是创建一系列分析报告,包括回报率、持仓分析、交易分析、贝叶斯分析和循环交易分析。这些报告有助于深入分析策略的性能,并提供了各种调整参数以适应不同的分析需求

然后,向下看,full_tear_sheet 调用了 create_returns_tear_sheet , interesting_times_tear, 并根据参数是否调用 position_tear, txn_tear, capacity_tear, risk_tear以及perf_atrrib_tear和bayesian_tear等。另外还有一个simple_tear_sheet与之相对应。

名为 create_simple_tear_sheet 的函数,它是 pyfolio 库的一部分,用于生成一个更简单的投资组合表现分析报告。这个报告以单个图像的形式展示了汇总绩效统计数据和重要图表。

这个函数的主要目的是创建一个简化的投资组合表现分析报告,它包含以下图表:

  • 累积回报率
  • 滚动贝塔值
  • 滚动夏普比率
  • 资金亏损图
  • 暴露度
  • 前10大持仓
  • 总持仓
  • 多头/空头持仓
  • 每日周转率
  • 交易时间分布

与 create_full_tear_sheet 函数相比,create_simple_tear_sheet 函数不接受 market_data 和 sector_mappings 输入,不执行bootstrap分析,不在前10大持仓图中隐藏持仓符号名称,并总是使用默认的 cone_std 值。

代码实践与问题

大概了解了pyfolio上要做点什么,我们就来进行代码的实践了。首先,与官方文档用相同的函数进行测试,

#..................    
    pyfoliozer = strat.analyzers.getbyname('pyfolio')
    returns, positions, transactions, gross_lev = pyfoliozer.get_pf_items()

    pf.create_full_tear_sheet(
        returns,
        positions=positions,
        transactions=transactions,
        live_start_date='2023-01-11')
IndexError: single positional indexer is out-of-bounds

虽然不知道哪里出错了,但可以试一下改变参数,因为从下面的源码上看,当position为None以及transactions为None会有些函数不运行,这样或许就可以把问题锁定到更小的范围内

    create_returns_tear_sheet(
        returns,
        positions=positions,
        transactions=transactions,
        live_start_date=live_start_date,
        cone_std=cone_std,
        benchmark_rets=benchmark_rets,
        bootstrap=bootstrap,
        turnover_denom=turnover_denom,
        header_rows=header_rows,
        set_context=set_context)

    create_interesting_times_tear_sheet(returns,
                                        benchmark_rets=benchmark_rets,
                                        set_context=set_context)

    if positions is not None:
        create_position_tear_sheet(returns, positions,
                                   hide_positions=hide_positions,
                                   set_context=set_context,
                                   sector_mappings=sector_mappings,
                                   estimate_intraday=False)

        if transactions is not None:
            create_txn_tear_sheet(returns, positions, transactions,
                                  unadjusted_returns=unadjusted_returns,
                                  estimate_intraday=False,
                                  set_context=set_context)
#     pf.create_full_tear_sheet(
#         returns,
#         positions=positions,
#         transactions=transactions,
#         live_start_date='2023-01-13')

    pf.create_full_tear_sheet(returns,live_start_date='2023-01-13')

这次仍然报错,但已经有部分的数据输出了。

Start date2023-01-16
End date2024-07-16
In-sample months0
Out-of-sample months17
In-sampleOut-of-sampleAll
Annual returnnan%7.9%7.9%
Cumulative returnsnan%11.6%11.6%
Annual volatilitynan%17.6%17.6%
Sharpe ratioNaN0.520.52
Calmar ratioNaN0.560.56
StabilityNaN0.610.61
Max drawdownnan%-14.2%-14.2%
Omega ratioNaN1.161.16
Sortino ratioNaN0.840.84
SkewNaN1.101.10
KurtosisNaN8.448.44
Tail ratioNaN0.900.90
Daily value at risknan%-2.2%-2.2%
---------------------------------------------------------------------------
AttributeError: 'Series' object has no attribute 'iteritems'
AttributeError 'iteritems'

这个问题下列几个参考文档都有提供解决方案

  • pyfolio工具结合backtrader分析量化策略组合,附源码+问题分析-CSDN博客
  • Backtrader 试用,empyrical、pyfolio、quantstats记录-CSDN博客

"pyfolio\plotting.py", line 648

直接改pyfolio源码,将648行改为:

  1. #for stat, value in perf_stats[column].iteritems():

  2. for stat, value in perf_stats[column].items():

这个改掉后,注意要重启Notebook的Kernel,否则之前的.py已经Load进内核了,不重启它不会改变的。然后,这个问题不报了,还会出现其他的问题。根据参考文档的提示,可能需要更改好多个.py文件,这些就变成了额外的工作量。我们现在是在backtrader的主线上走一个更多评价指标的分支,太多的额外工作量让我们的实践脱离了正轨,所以我们准备对pyfolio说"No"了。

使用simple_tear

在say No之前,各种方法都再试用一下,前提是不用花费太多的时间,根据前面看到的,simple_tear会生成更简洁的分析报告,那就试一下。

pf.create_simple_tear_sheet(returns,live_start_date='2023-01-13')

--------------------
IndexError: index -1 is out of bounds for axis 0 with size 0

结果,首先表格出来了,其次,出来3张图的背景,cumulative returns还显示了红色的线,但仍然报错没有走完。

仔细想一下,我们之前想要的就是pyfolio来计算一些评价指标而已,并不是需要炫酷的图像输出,因为那一支股票一个策略的一堆图像在大量股票和多策略的大数据下,起不到太大的作用,我们要的是大量数据的统计,而不是一支的各维度的图像显示。

_另一个方向的实践

之前的目标是用pyfolio来计算评价指标,比如阿尔法收益,MAR率,Omega等,而且我问AI得到的代码说就是用pyfolio来计算的,但事实证明这次AI又错了(错误示例见下面代码)。好几次了,AI辅助编程,平时能带给你一些小的省事,关键的时候却是误导你出大的错误。这些像不像一些股评家,平时听他们的可能有一点小的盈利,关键的时候来一个杀猪盘......

from pyfolio import alpha_beta

# 假设你有backtrader的回测结果
# 这里我们使用一个假设的收益率序列作为示例
cumulative_returns = [0.02, 0.03, 0.04, 0.05, 0.06]
benchmark_returns = [0.01, 0.02, 0.03, 0.04, 0.05]

# 计算阿尔法和贝塔
alpha, beta = alpha_beta.alpha_beta(cumulative_returns, benchmark_returns)

print(f"阿尔法(Alpha): {alpha}")
print(f"贝塔(Beta): {beta}")

----------------------------------
ImportError: cannot import name 'alpha_beta' from 'pyfolio'

而现在我们虽然卡在了绘图上,但是一些评价指标已经出来了,以表格的形式。也就是说在报错之前,我们已经可以从另一个方向上获取到评价指标的计算了。

我们需要从源码上一点一点去搜索,先从simple_tear的函数上看,除了returns是必须的外,其他基本上默认都是None,这样很多代码类似 xx is not None 的判断语句块就可以直接跳过不看。

def create_simple_tear_sheet(returns,
                             positions=None,
                             transactions=None,
                             benchmark_rets=None,
                             slippage=None,
                             estimate_intraday='infer',
                             live_start_date=None,
                             turnover_denom='AGB',
                             header_rows=None):
#.........

于是得到的第一个执行的函数是

    plotting.show_perf_stats(returns,
                             benchmark_rets,
                             positions=positions,
                             transactions=transactions,
                             turnover_denom=turnover_denom,
                             live_start_date=live_start_date,
                             header_rows=header_rows)

我们在自己的程序里调用它,然后得到了表格的输出

这就说明了上面表格里的一堆评价指标已经完成计算了。因此,一步一步撸源码,从plotting.show_perf_stats里的perf_stats到 timeseries中的perf_stats,然后从大写的SMIPLE_STST_FUNCS看到list里有一堆ep.开头的、非常像评价指标计算的函数调用。接着再点进去跳到empyrical\stats下的例如 def omega_ratio()函数,这就是我们一直想找的评价指标的计算部分了。

注意,我们找到了评价指标计算的部分,但它已经不在pyfolio里面,

从另一方向,我们发现了pyfolio可能主要是来绘制表格和图形的,而评价指标的计算并不在它里面,而是调用的empyrical库进行的。因此,我们的实践又跳转到empyrical了。

B_empyrical的实践

或许是前面安装了pyfolio的原因,empyrical的库直接就可以使用了。

01_几个评价指标的计算示例

首先,我们用help(), dir()来学习一下empyrical的基础

import empyrical as ep
help(ep.stats)
# .........略

dir(ep.stats)
# .........略

# 得到的一些指标如下:
from .stats import (
    aggregate_returns, alpha, alpha_aligned, alpha_beta, alpha_beta_aligned,
    annual_return, annual_volatility, beta, beta_aligned, cagr,
    beta_fragility_heuristic, beta_fragility_heuristic_aligned, gpd_risk_estimates,
    gpd_risk_estimates_aligned, calmar_ratio, capture, conditional_value_at_risk,
    cum_returns, cum_returns_final, down_alpha_beta, down_capture, downside_risk,
    excess_sharpe, max_drawdown, omega_ratio, roll_alpha, roll_alpha_aligned,
    roll_alpha_beta, roll_alpha_beta_aligned, roll_annual_volatility, roll_beta,
    roll_beta_aligned, roll_down_capture, roll_max_drawdown, roll_sharpe_ratio,
    roll_sortino_ratio, roll_up_capture, roll_up_down_capture, sharpe_ratio,
    simple_returns, sortino_ratio, stability_of_timeseries, tail_ratio, up_alpha_beta,
    up_capture, up_down_capture, value_at_risk
)

看起来有不少,我们就挑几个进行实践,这里继续通过AI来生成示例代码

001_夏普率

import pandas as pd
from empyrical import *

# 假设你有Backtrader的回测结果
# 这里我们使用一个假设的收益率序列作为示例
cumulative_returns = [0.02, 0.03, 0.04, 0.05, 0.06]
returns1 = pd.Series(cumulative_returns)

# 计算夏普比率
sharpe_ratio = sharpe_ratio(returns1,risk_free=0)

print(f"夏普比率: {sharpe_ratio}")

------------------------
夏普比率: 40.15968127363563

从示例代码上看,大多数的评价指标都以日收益率进行计算的,并且要求为pandas.Series类型。

002_Calmar 比率

import empyrical
import pandas as pd

# 假设您有一个包含每日收益率的 pandas Series
daily_returns = pd.Series([0.01, -0.02, 0.03, 0.04, -0.05, 0.06])

# 计算 Calmar 比率
calmar_ratio_value = empyrical.calmar_ratio(daily_returns)

print(f"Calmar Ratio: {calmar_ratio_value}")

-------------------
Calmar Ratio: 293.20185460273103

003_计算MAR率

前面我们已经学习到MAR率是年化收益率/ 最大回撤率得到的,empyrical中没有直接的MAR率,但我们可以通过简单的除法运算得到

import empyrical
import pandas as pd

# 假设您有一个包含每日收益率的 pandas Series
daily_returns = pd.Series([0.01, -0.02, 0.03, 0.04, -0.05, 0.06])

# 计算 最大回撤
max_drawdown = empyrical.max_drawdown(daily_returns)

# 计算 累计收益
cumulative_returns = empyrical.cum_returns(daily_returns)
max_cumulative_return = cumulative_returns.max()

# 计算 MAR 比率
mar_ratio = max_cumulative_return / -max_drawdown

print(f"MAR Ratio: {mar_ratio}")

--------------------
MAR Ratio: 1.3539135264

004_计算年化波动率和标准离差

从示例代码上,我们也看到了年化波动率有函数直接得出,而标准离差需要再计算其方差和开根号操作才能间接得到,我们的实践也从直接调用评价指标函数慢慢升级到调用2个函数并做简单乘除,再升级到调用函数后做std()和sqrt()等较复杂的计算,这里还使用了numpy。

import empyrical
import pandas as pd
import numpy as np

# 假设您有一个包含每日收益率的 pandas Series
daily_returns = pd.Series([0.01, -0.02, 0.03, 0.04, -0.05, 0.06])

# 计算 年化波动率
annual_volatility_value = empyrical.annual_volatility(daily_returns)

# 计算 年化波动标准离差
# 假设一年有252个交易日
trading_days = 252
annualized_standard_deviation = np.std(daily_returns) * np.sqrt(trading_days)

print(f"Annual Volatility: {annual_volatility_value}")
print(f"Annualized Standard Deviation: {annualized_standard_deviation}")

----------------------------
Annual Volatility: 0.6461269225160022
Annualized Standard Deviation: 0.5898304841223451

005_计算阿尔法-贝塔收益

简单的引用参考文档中关于阿尔法-贝塔的说明

阿尔法(alpha、α值)

投资者获得与市场波动无关的回报,也叫超额收益。 比如投资者获得了15%的回报,其基准获得了10%的回报,那么Alpha或者价值增值的部分就是5%


10. 贝塔(beta、β值)

反映了策略对大盘变化的敏感性。例如一个策略的Beta为1.5,则大盘涨1%的时候,策略可能涨1.5%,反之亦然。

具体计算方法为:策略每日收益与参考标准每日收益的协方差/参考标准每日收益的方差。
Beta coefficient = Covariance(Re, Rm)/Variance(Rm)
其中:Re为单一股票的回报, Rm为整体市场的回报,Covariance为股票收益相对整体市场收益的变化情况, Variance为市场数据远离平均值的幅度

从说明上看,这些评价指标不是用一个策略的returns就能计算的,它必须还有一个市场收益率的数据,两者做比较才能得出结果。示例代码仍然非常简单,多生成一个Series数据即可:

import empyrical
import pandas as pd

# 假设您有一个包含每日投资组合收益率的 pandas Series
portfolio_returns = pd.Series([0.01, -0.02, 0.03, 0.04, -0.05, 0.06])

# 假设您有一个包含每日市场基准收益率的 pandas Series
benchmark_returns = pd.Series([0.005, -0.01, 0.02, 0.03, -0.04, 0.05])

# 计算 Alpha 和 Beta
alpha, beta = empyrical.alpha_beta(portfolio_returns, benchmark_returns)

print(f"Alpha: {alpha}")
print(f"Beta: {beta}")

-----------------------------
Alpha: -0.008330392443637757
Beta: 1.2763485477178422

02_放回到backtrader中进行计算

001_有returns就能计算的

backtrader自身的Analyzer中就有TimeReturn,由于大部分的评价指标有returns就能计算,这个部分的测试就比较轻松,我们以夏普比率和之前backtrader出不了值的Calmar率做个简单的应用

def add_analyzer_all(cerebro):
    # 需要通过数据记录进行计算    
    cerebro.addanalyzer(bt.analyzers.TimeReturn, _name='pnl') # 返回收益率时序数据    # 03

import empyrical
import pandas as pd
import numpy as np

def analyzer_output(result):
    dic1 = {}
    sout03 = result.analyzers.pnl.get_analysis()

    daily_returns = pd.Series(sout03)

    # 计算 Calmar 比率
    calmar_ratio_value = empyrical.calmar_ratio(daily_returns)  # 之前backtrader 14_calmar是NaN
    print(f"Calmar Ratio: {calmar_ratio_value}")

    # 计算夏普比率
    sharpe_rat = empyrical.sharpe_ratio(daily_returns,risk_free=0)
    print(f"夏普比率: {sharpe_rat}")

----------------------------
Calmar Ratio: 0.5598883363715573
夏普比率: 0.5211845089137789

002_需要基准收益的

什么是基准日收益

我们还是直接问AI

包含市场基准日收益率的 benchmark_returns,请问是具体指什么,例如是上证指数,沪深300指数吗?

是的,benchmark_returns 通常指的是市场基准的日收益率,这可以是一个广泛认可的市场指数,如上证指数、沪深300指数、标普500指数等。市场基准是一个被广泛用作投资表现比较标准的指数,它代表了一个特定的市场或市场部门的表现。

在计算 Alpha 和 Beta 时,市场基准的收益率被用来衡量投资组合相对于市场的表现。

Alpha 衡量的是投资组合相对于基准的超额收益,而 Beta 衡量的是投资组合收益与基准收益的同步波动性。Beta 值大于 1 意味着投资组合的波动性大于市场,而 Beta 值小于 1 意味着波动性小于市场。

获取基准日收益

我们已经在backtrader里探索了一段时间了,从一开始我们就要下载数据,制作成feeddata接受的格式,然后已经很长时间没有去回顾这个操作了。这几天的Analyzer的实践,已经习惯了从.run()之后取数据,突然要多一个基准日收益,反而有些不知所措了。

其实,在我们的K线数据文件夹下面,就有指数的.csv文件,我们可以直接读取这个文件来获取数据然后计算出日收益。

fname = 'dayData/999999_raw.csv'
df = pd.read_csv(fname, index_col='trade_date')
df
trade_dateopenhighlowclosevolumeopeninterest
2022-10-252969.163001.722944.262976.28255554160.00
2022-10-262977.563028.352977.562999.50268689504.00
2022-10-273005.043017.262981.692982.90265608256.00
2022-10-282967.022974.242908.982915.93292531296.00
2022-10-312893.202926.022885.092893.48301994208.00
.....................
2024-07-102949.032958.862935.332939.36301549440.00
2024-07-112957.252971.362947.402970.39328372416.00
2024-07-122965.612977.142963.302971.30303713024.00
2024-07-152963.852977.312959.132974.01268992608.00
2024-07-162963.902977.362959.672976.30260783632.00

420 rows × 7 columns

计算出日收益率

拿到了DataFrame的数据,心里有个简单的概念,用(今天收盘-昨天收盘)/昨天收盘就得到了日收益率,第一反应是做一个函数让pandas去apply。 然后第二反应是问下AI怎么做。这次AI给了一个不错的回答, dataframe可以直接用.pct_change()得到日收益率。

df['pct_change'] = df['close'].pct_change()
获取起止范围内的日收益率

在简单测试的时候,我们直接创建2个Datetime即可,

# d1,d2均为datetime类型
date1_str = "2023-01-11"
date2_str = "2024-07-18"
d1 = datetime.strptime(date1_str, "%Y-%m-%d")
d2 = datetime.strptime(date2_str, "%Y-%m-%d")

filtered_df = df.loc[d1:d2]
制作函数并在analyzer_output中调用
def my_get_benchmark_returns(datestart,dateend):
    fname = 'dayData/999999_raw.csv'
    df = pd.read_csv(fname)
    df['pct_change'] = df['close'].pct_change()   # 计算出日收益率
    
    # 将 'trade_date' 列转换为日期格式,并将其设置为索引
    df['trade_date'] = pd.to_datetime(df['trade_date'])
    df.set_index('trade_date', inplace=True)

    filtered_df = df.loc[datestart:dateend]
    ret1 = filtered_df['pct_change']
    return ret1

def analyzer_output(result):
    sout03 = result.analyzers.pnl.get_analysis()
    daily_returns = pd.Series(sout03)

    # 通过daily_returns获取 起、止日期
    datestart = daily_returns.index[0]
    dateend = daily_returns.index[-1]

    bench_returns = my_get_benchmark_returns(datestart,dateend)
    # print(bench_returns)
    
    # 计算 Alpha 和 Beta
    alpha, beta = empyrical.alpha_beta(daily_returns, bench_returns)
    
    print(f"Alpha: {alpha}")
    print(f"Beta: {beta}")

------------------------------------
Alpha: 0.10868566697398885
Beta: 0.2365168968524076

C_Quantstats实践

参考文档

  • Backtrader 量化回测实践(6)——量化回测评价工具Quantstats-CSDN博客
  • 量化策略——准备3 数据、Backtrader回测框架与quantstats评价指标_backtrader 模版-CSDN博客
  • 【从零开始玩量化13】quantstats:分析你的量化策略-CSDN博客
  • Backtrader 试用,empyrical、pyfolio、quantstats记录-CSDN博客

Quantstats主要功能

仍然把英文的说明交给AI解析:

 QuantStats 主要由以下三个模块组成:

  1. quantstats.stats:这个模块用于计算各种绩效指标,如夏普比率(Sharpe ratio)、胜率(Win rate)、波动率(Volatility)等。这些指标对于评估交易策略的风险与收益特性至关重要。

  2. quantstats.plots:此模块专注于可视化,提供图表以展示策略的绩效、回撤、滚动统计、月度回报等。这有助于直观理解策略的表现和潜在风险。

  3. quantstats.reports:这个模块用于生成绩效报告,批量绘图,并创建可以保存为HTML文件的详细分析表(tear sheets)。这对于整理和分享策略的全面分析结果非常有用。

这些模块共同构成了 QuantStats,使其成为量化交易策略分析和报告生成的强大工具。

其中,.stats模块就是各种评价指标计算的模块,也是我们这次实践的主要目的;不过在尝试了plots模块后,发现有惊喜~

stats模块实践

首先是确定是否需要安装 quantstats,很明显目前是没有安装的。

import quantstats as qs

---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)
Cell In[125], line 1
----> 1 import quantstats as qs

ModuleNotFoundError: No module named 'quantstats'

安装命令

pip install quantstats

001_夏普率

df = pd.DataFrame({
    'returns': [0.01, -0.02, 0.03, 0.04, -0.05, 0.06]  # 示例数据
})

# 计算夏普比率
sharpe_ratio = qs.stats.sharpe(df['returns'], rf=0.02)
print(f"Sharpe Ratio: {sharpe_ratio}")

----------------------------
Sharpe Ratio: 4.519540190723975

我们看到,如果只是运行示例代码会非常简单,它与前面的empyrical的调用方式差不多

在backtrader中使用时,还是在analyzer_output()函数中,先获取 03_TimeReturn的数据,然后调用qs.stats.XXX()来进行评价指标计算。

002_calmar率 与003_MAR率

我们还是把代码放回到backtrader的Analyzer中进行实践

import quantstats as qs
import pandas as pd
def add_analyzer_all(cerebro):
    cerebro.addanalyzer(bt.analyzers.TimeReturn, _name='pnl') # 返回收益率时序数据    # 03

def analyzer_output(result):
    dic1 = {}
    sout03 = result.analyzers.pnl.get_analysis()
    returns = pd.Series(sout03)

    # 夏普率
    sharp_qs = qs.stats.sharpe(returns,rf=0)
    dic1['qs_夏普率'] = sharp_qs

    # calmar率
    calmar_qs = qs.stats.calmar(returns)
    dic1['qs_calmar'] = calmar_qs

    # MAR率
    max_drawdown = qs.stats.max_drawdown(returns)    # 计算最大回撤(Maximum Drawdown)
    average_return = qs.stats.avg_return(returns)  # 计算平均收益率(Average Return)
    mar_ratio = -max_drawdown / average_return    # 计算 MAR 比率
    dic1['qs_MAR'] = mar_ratio
    print(dic1)

-------------------------------
{'qs_夏普率': 0.5211845089137789, 
'qs_calmar': 0.3653708565550549, 
'qs_MAR': 173.7097122199193}

004_年化波动率

我们在notebook中直接借用刚才得到的returns的数据,可以看到包括年化波动率计算也是直接调用写好的函数进行的,函数内容从源码中也能看得到。

# "年波动率": 
volat = qs.stats.volatility(ret1)
volat

'''
def volatility(returns, periods=252, annualize=True, prepare_returns=True):
    """Calculates the volatility of returns for a period"""
    if prepare_returns:
        returns = _utils._prepare_returns(returns)
    std = returns.std()
    if annualize:
        return std * _np.sqrt(periods)

    return std
'''

---------------------
0.12866840859812584

005_阿尔法-贝塔收益

最后,我们又来到alpha-beta这个评价指标上了,前面在empyrical里已经知道了,对于部分指标它需要添加市场benchmark的日收益率做为基准才能进行计算,我们又可以借用刚才制作的函数。

def my_get_benchmark_returns(datestart,dateend):
    fname = 'dayData/999999_raw.csv'
    df = pd.read_csv(fname)
    df['pct_change'] = df['close'].pct_change()   # 计算出日收益率
    
    # 将 'trade_date' 列转换为日期格式,并将其设置为索引
    df['trade_date'] = pd.to_datetime(df['trade_date'])
    df.set_index('trade_date', inplace=True)

    filtered_df = df.loc[datestart:dateend]
    ret1 = filtered_df['pct_change']
    return ret1


def add_analyzer_all(cerebro):
    cerebro.addanalyzer(bt.analyzers.TimeReturn, _name='pnl') # 返回收益率时序数据    # 03

def analyzer_output(result):
    dic1 = {}
    sout03 = result.analyzers.pnl.get_analysis()
    returns = pd.Series(sout03)

    # alpha-beta
    datestart = returns.index[0]    # 通过daily_returns获取 起、止日期
    dateend = returns.index[-1]
    bench_returns = my_get_benchmark_returns(datestart,dateend)

    alphabeta = qs.stats.greeks(returns, bench_returns)
    dic1['qs_alpha'] = alphabeta.alpha
    dic1['qs_beta'] = alphabeta.beta
    
    print(dic1)
---------------------------
{'qs_alpha': 0.10319635410459166, 
'qs_beta': 0.23651689685240762}

从以上的实践可以看到,使用quantstats与使用empyrical做评价指标计算的时候,它们的用法非常近似:

  • 大多数只需要returns就可以进行计算的,一般都是调用函数就可以
  • 部分需要添加基准日收益率的,其他过程的程序代码和函数都可以不用变化,只需要对应的函数调用不同即可

我们看到,alpha-beta的计算,两者结果是一致的,但是某些指标结果并不相同,这里我们暂时不去深究为什么了,empyrical和quantstats这两个库如果只是作为backtrader的Analyzer的辅助额外评价指标的计算,任选其一即可。

plot模块-绘图功能实践

到这里,其实本节的实践内容已经结束了,pyfolio的确如很多的参考文档写的不那么容易用起来,但我们通过它调用发现了empyrical库,然后能用empyrical库去快速得到一些backtrader没有的评价指标;然后我们又实践了quantstats库的评价指标计算功能,看起来与empyrical算是英雄所见略同吧。

在实践quantstats的过程中,尝试了绘图的功能,又带来一些额外的惊喜,所以这个部分继续。

有哪些绘图功能

# 
from quantstats._plotting import wrappers 
dir(wrappers)
-------------------------

把dir出来的内容再次交给AI进行整理,有19个函数:

  1. daily_returns: 计算每日收益率。
  2. distribution: 绘制收益率分布。
  3. drawdown: 计算最大回撤。
  4. drawdowns_periods: 列出最大回撤发生的日期。
  5. earnings: 计算累计收益。
  6. histogram: 绘制收益率直方图。
  7. log_returns: 计算对数收益率。
  8. monthly_heatmap: 绘制月收益率热力图。
  9. monthly_returns: 计算月收益率。
  10. plotly: 生成 Plotly 图表。
  11. returns: 计算收益率。
  12. rolling_beta: 计算滚动贝塔值。
  13. rolling_sharpe: 计算滚动夏普比率。
  14. rolling_sortino: 计算滚动 Sortino 比率。
  15. rolling_volatility: 计算滚动波动率。
  16. snapshot: 创建快照。
  17. to_plotly: 将 DataFrame 转换为 Plotly 图表。
  18. warnings: 显示警告。
  19. yearly_returns: 计算年收益率。

001_日收益,回撤,累计收益与Snapshot

如标题,快照snapshot直接把日收益(daily_returns),回撤(drawdown)和累计收益(earnings)一起进行了绘图输出

qs.plots.snapshot(returns=ret1)

002_月热力分布图

qs.plots.monthly_heatmap(ret2,ret1)

开启亮眼模式,从这个热力分布图。注意国际上都是红跌绿涨跟我们大A是反着的,所以图也要反着颜色看,这张图让你知道每年大概哪几个月会赚钱~

003_直方图-histogram

直方图和正态分布图都能比较好的显示你的盈亏分布,如下图黄色代表上证指数有11次都在0%,赚8%的次数2次,其他外包装是0~-4%之间,而蓝色的这支股票,有2次-20%......

qs.plots.histogram(ret2,ret1)

004_分布图 distribution

qs.plots.distribution(returns=ret2)

在完成绘图模块的实践之后,我又冒出来很多的念头,比如说我们做个窗口程序来回测backtrader,然后把策略的日收益(有阶段不交易收益率为0)和基准的日收益存在self.xx里面,后面看多个股票多个策略的评价列表的时候,选择想看的那一行,然后再让quantstats进行绘图,这样就更有针对性,而且是建立在对大体评分已经有数的情况下,我觉得对于选股、选策略甚至择时都会有帮助......

report报告模块

报告就是把一堆评价指标的数据以表的形式,然后一些与时间相关的画成图,在一起显示。这里与我们的主线任务关系并不大,简单看下:

qs.reports.basic(returns=ret2, benchmark=ret1,rf=0.01, prepare_returns=False)

basic会生成表格和几张图,表格里的基本上就是我们前面一直在研究的评价指标,它这里很贴心地也加上了类似基本近x期的涨幅指标,如图:

report模块里还有很多的函数,先把它们列在这里,但我们先不去实践了。

  1. basic: 用于生成基本的性能指标。
  2. full: 用于生成完整的性能指标。
  3. html: 用于生成 HTML 格式的报告。
  4. iDisplay: 用于在 Jupyter Notebook 中显示数据。
  5. iHTML: 用于生成交互式 HTML 报告。
  6. metrics: 用于计算各种性能指标。
  7. plots: 用于绘制各种图表。
  8. relativedelta: 用于计算两个日期之间的相对差异。

本节小结

  1. 从backtrader内置的pyfolio到外部的pyfolio库的应用
  2. pyfolio目前用起来容易出现一些错误,影响主线进度,实践中发现评价指标的计算是调用empyrical进行的
  3. 对empyrical的评价指标函数的调用进行了实践,总体而言使用是很方便的
  4. 对quantstats的stats模块进行了实践,这个与empyrical的功能很近似,使用也很方便
  5. 对quantstats的绘图功能进行了尝试,某些图(例如热力图,直方图等)为我们分析选择股票提供了实用的可视化信息

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2082958.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python TensorFlow入门与实践

摘要 本文旨在详细介绍如何使用Python和TensorFlow进行基本的深度学习任务。我们将从安装TensorFlow开始,逐步讲解如何创建简单的神经网络模型,并通过一个具体的示例来演示如何训练模型。此外,我们还将讨论一些高级主题,如卷积神…

“长风破浪”计划创作营圆满结营 9月10日“2024华韵视听大会”佛山见

8月26日,“长风破浪”青年音乐人唱享计划与青年影视人扶持计划创作营在佛山高明皂幕山上圆满结营。首季创作营历时一周,在高强度的创作中,20位青年影视人和音乐人群策群力,超额完成任务,共创两首歌曲、一部微短剧及一部…

Wails实现桌面番茄钟应用

0.项目背景 最近在优化自己的工作流,在工作方法上开始使用番茄钟来实现时间控制,一直觉得番茄钟的方式有点silly,直到自己用过之后才发现,番茄钟是真的好用,它不止是工作的方法,更是休息的艺术&#xff0c…

流程图还不会画?这个AI工具一键出图,还有上万模版库可选

我是娜姐 迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。 流程图的绘制在工作中很常见。大家在写论文、课题申请等经常会用到需要绘制技术路线、工作流程、病人筛选流程等。 有没有AI工具能够根据我们的描述文字,一键生成流…

aspeed2600 openbmc对mctp over pcie的支持分析(支持mctp over pcie)

遍搜全网,竟然关于openbmc mctp over pcie的支持说明情况了无文章,这不是一个艰难的问题,服务器BMC也不是一个超级精尖的产品,想当年分享stm32资料,都是满天飞。可能服务器市场大家对于文章上的分享并无兴趣。 此篇文…

网络安全总结②

上一篇:网络安全总结① 下一篇: 传统防火墙 传统防火墙 技术:访问控制、代理技术、会话机制 工作层次:应用层一下 防御模式:通过防御设备划分边界,基于IP/端口和特征进行判断;以隔离为基础&am…

【Spring Boot 3】自定义拦截器

【Spring Boot 3】自定义拦截器 背景介绍开发环境开发步骤及源码工程目录结构总结背景 软件开发是一门实践性科学,对大多数人来说,学习一种新技术不是一开始就去深究其原理,而是先从做出一个可工作的DEMO入手。但在我个人学习和工作经历中,每次学习新技术总是要花费或多或…

茶余饭后(六)

有人孤立你,证明你强大;有人嫉妒你,证明你出众;有人诋毁你,证明你有能力;有人议论你,证明你有价值;有人利用你,证明你有能力。所以原谅那些诋毁你的人,至少他…

到处在裁员,这个行业却在疯狂招人!

1.裁员浪潮不断 8月26日,IBM中国方面确认了将关闭中国研发部门的消息,这一决策涉及员工数量超过1000人。技术迭代浪潮前,哪怕是名企,攻守防退之间的转换也只在一瞬间。AI引发大裁员?这表明IBM正在积极适应技术变革&am…

win10配置adb环境变量

初始状态: 最简单的配置方案,直接复制adb所在路径: 粘贴进来确定即可: 然后打开 cmd 查看已经配置成功了:

MATLAB 手写Ply文件点云读取类(86)

MATLAB 手写Ply文件点云读取类(86) 一、算法介绍二、算法实现1.PLYReader.m 类文件2.可视化一、算法介绍 PLY是一种常见的点云文件格式,这里尝试手写一个读点云的类,查看是否能正常读取,结果将可视化,具体代码如下: 二、算法实现 1.PLYReader.m 类文件 classdef PLYR…

优秀的开源项目

目录 热key 多线程并行 秒级百G级日志工具 ES操作工具 消息推送平台 HTTP 客户端 业务层的分布式限流组件 企业级微服务解决方案 热key hotkey: 京东App后台中间件,毫秒级探测热点数据,毫秒级推送至服务器集群内存,大幅降低热key对数…

MinIo - java代码 实现图片上传至Minio桶

MinIO是一款开源的高性能、可伸缩、安全的对象存储系统,专为云原生和容器化环境而设计 (基于minio已经集成在服务器中) 第一步,毫无疑问肯定是创建一个桶(用于存放的容器) 这个Name根据自己的需求自定义 然后点击Create Bucket 可以看见新创建的桶已经完成 点击新创建的…

es集群详解

1、集群的介绍: 1.1、单机的elasticsearch做数据存储 必然面临两个问题:海量数据存储问题、单点故障问题。海量数据存储问题:将索引库从逻辑上拆分为N个分片(shard),存储到多个节点。从逻辑上&#xff0c…

docker 镜像仓库的管理

目录 1 docker 镜像仓库介绍 1.1 什么是docker仓库 1.2 docker hub 2 docker仓库的工作原理 2.1 仓库中的三个角色 2.2 pull原理 2.3 push原理 3 使用互联网上提供的托管镜像仓库 3.1 docker hub 镜像仓库 3.1.1 docker hub 镜像仓库介绍 3.1.2 docker hub的使用方法 4 搭建doc…

数据仓库系列11:ETL的主要步骤是什么,它们分别有什么作用?

你是否曾经感觉被海量数据淹没?是否在寻找一种方法来有效地整合、转换和加载这些数据?如果是,那么你来对地方了。今天,我们将深入探讨ETL(Extract, Transform, Load)过程的三个关键步骤,这是每个大数据开发者都应该掌握的核心技能。准备好踏上成为数据整合大师的旅程了吗?让…

Dubbo源码解析之@DubboService、@DubboReference(Dubbo源码一)

更好的阅读体验:Dubbo源码解析之DubboService、DubboReference(Dubbo源码一) 视频讲解:https://www.bilibili.com/video/BV1nBsMejEbL 对于Dubbo用的最多的就是DubboService、DubboReference,与之对应的就是服务的提供…

diskgenuis打开vmdk文件提示读扇区错误

使用DiskGenius_V5_2_x86打开iKuai-0.vmdk 读扇区错误! 磁盘: 起始于 0 扇区 共 1 个扇区。 (Err:0) 读扇区错误! 磁盘: VD0:iKuai-0.vmdk(2GB) 起始于 0 扇区 共 2 个扇区。 (Err:0) 更换官网最新版本 https://www.diskgenius.cn/download.php 可…

一个PPT做3天?有这3个AI做PPT工具再也不发愁!

ppt是什么东西? ppt是英文Powerpoint的缩写,它是微软出品的演示文稿软件,因为其在演示领域的领导地位,也让它成为幻灯片或演示文稿的代名词。 一个完整的ppt,通常包含很多要素,如ppt封面页、ppt目录页、p…

解决Java中Long类型的序列化与JDK8时间的序列化

1.背景 SpringBoot与前端交互 这个场景下Long类型与前端JS交互时会存在精度丢失,根本原因是JS的Number支持不到19位,所以需要后端将Long类型的值转为StringJDK8的时间类 JDK8的时间类比如LocalDateTime、LocalDate 在交互时序列化默认格式是 “yyyy-MM-…