许多同学只是把Qlib当做一个简单的工具来学习。其实Qlib隐含了一套正规的投研流程,从投研流程的视角去学习Qlib,则不仅能加深对Qlib的理解,而且能够掌握正确的投研流程,哪怕以后不使用Qlib而是使用其他系统了,这套流程还是适用的。以下,我们简单勾勒一下Qlib中的投研流程。
1. 基本特征存储
如ohlcv以及其他外部特征如pe等,存为qlib内置格式。
2. 因子与标签计算与过滤加载
3. 因子与标签预处理
生成df数据帧_infer,用于提供测试集数据,生成_learn,用于提供训练和验证集数据。
4. 训练
5. 预测
6. 回测
以上是主要流程。另外两个子流程因子评估,组合权重优化也可以在Qlib完成。
初学者可能更加关注步骤4,5,6。实际上最费时、最重要的工作是步骤2,3,即如何设计因子与标签,应该对它们做怎样的预处理,这种工作做好了,后面的训练预测只是一个模型调用而已。
01:30