KDD'23 | AlphaMix: 高效专家混合框架(MoE)显著提高上证50选股表现
原创 QuantML QuantML 2024-04-18 09:17 上海
Content
本文提出了一个名为AlphaMix的新型三阶段专家混合(Mixture-of-Experts,MoE)框架,旨在模拟现实世界交易公司中高效的自底向上的交易策略设计工作流程,以进行量化投资。
主要贡献
-
提出了AlphaMix,这是首个针对量化投资的专家混合框架。
-
在真实世界数据上进行了实验,证明了AlphaMix在多个财务标准上显著优于11个现有的最先进基线方法。
模型概述
AlphaMix框架分为三个阶段:
第一阶段:高效的集成学习方法
-
利用个性化的市场理解和交易风格来训练多组交易专家。
-
通过两个可训练的向量(代表市场理解和交易风格)生成独立的秩一矩阵,并通过哈达玛德积(Hadamard product)生成集成权重。
第二阶段:构建多样化的交易专家池
-
通过利用神经网络的超参数层面和初始化层面的多样性,构建一个多样化的交易专家池。
-
使用随机搜索和顶级集成选择方法来增加模型的多样性。
第三阶段:动态选择专家
-
设计了三种不同的机制来动态选择专家池中的专家,这些专家负责投资组合经理的职责:
-
按需路由器(As-needed router)
-
有放回选择(With-replacement selection)
-
集成专家汤(Integrated expert soup)
-
实验
-
在美国和中国的股票市场上进行了广泛的实验,以评估AlphaMix的性能。
-
使用了两个真实世界的数据集:ACL18(美国股票)和SZ50(中国股票)。
-
根据7个流行的财务标准进行评估,包括总回报率、波动性、下行偏差、最大回撤、夏普比率、卡玛比率和索提诺比率。
结果
-
AlphaMix在多个财务标准上显著优于多个现有的基线方法,包括RNN、NRNN、BDT和集成学习方法。
-
通过消融研究展示了AlphaMix各个组成部分的有效性。
计算成本
-
AlphaMix是一个高效的集成方法,解决了传统集成方法的高计算成本问题。
-
与DeepEns和HyperEns相比,AlphaMix在计算成本上具有显著优势。
多样性分析
-
使用预测不一致性指标来评估模型的多样性。
-
AlphaMix通过利用超参数和初始化的多样性,展现了比其他基线更好的多样性。
不确定性减少
-
展示了单一神经网络对随机种子的敏感性和高不确定性,而AlphaMix通过专家混合来解决这一问题。
参数分析
-
分析了AlphaMix在不同数量的选定股票和专家数量下的表现。
结论
AlphaMix通过模仿现实世界交易公司的工作流程,提出了一个高效的专家混合框架,用于量化投资。通过在两个国家的股票市场上的广泛实验,证明了AlphaMix在多个财务标准上的性能优势。
这篇论文的内容非常丰富,涵盖了量化投资的多个方面,包括模型设计、实验评估和参数分析。AlphaMix模型特别关注于通过集成学习和专家混合来提高投资决策的稳定性和性能。