×

华泰人工智能系列之二十二:基于CSCV框架的回测过拟合概率

hqy hqy 发表于2025-02-25 05:06:07 浏览9 评论0百度已收录

抢沙发发表评论

今天分享的是:华泰人工智能系列之二十二:基于CSCV框架的回测过拟合概率

报告共计:22页

《基于 CSCV 框架的回测过拟合概率》总结

本文聚焦量化投资中回测过拟合问题,基于组合对称交叉验证(CSCV)框架,以三组量化研究案例深入剖析回测过拟合概率(PBO)计算流程及相关要点。

过拟合分为训练与回测过拟合两层。训练过拟合系机器学习范畴,因超参数不当或过度训练致模型在训练集优、测试集差,可借合理交叉验证纠偏;回测过拟合属量化语境广义问题,源于市场规律变或对数据噪音过度研习,致使模型回测佳而实盘弱,检测其概率为关键解决路径。

CSCV 框架计算 PBO 的核心,是测“训练集”夏普比率最优策略于“测试集”的排名,前列则 PBO 低、反之则高。操作时,先将回测时长 T 均分为 S 份,取 S/2 份组“训练集”,余为“测试集”,算各策略夏普比率与排名,多次重复,视排名在后 50%的概率为 PBO。其优点显著,“训练集”“测试集”样本等量、策略对等、保留时序、非参灵活,夏普比率亦可按需换为他指标。

三组案例涵盖多因子选股与择时模型。案例 1 的 7 种机器学习选股模型,经多空、Top 及指数增强组合测试,各组合 PBO 多在 15% - 50%(指数增强组合夏普比率 PBO 部分情形除外),如 T/S = 8 时,多空 7.4%、Top 20.6%、指数增强超额收益净值 34.5%,表明“XGBoost 最优”大概率非过拟合。案例 2 的 6 种交叉验证多因子选股模型,逻辑回归与 XGBoost 多空组合 PBO 分别在 20% - 50%、10% - 40%(T/S = 48 除外),显示“分组时序交叉验证最佳”大概率非过拟合且 XGBoost 过拟合概率更低。案例 3 的双均线 50ETF 择时模型,7 组参数 PBO 多在 70% - 90%,91 组参数在 50% - 70%(T/S = 42 除外),显示“参数组合最优”大概率过拟合,且择时模型整体过拟合风险高于选股模型。

综上,CSCV 框架为量化策略回测过拟合检测提供有效工具,助投资者甄别策略优劣,为量化投资实践筑牢根基、指引方向,于多因子选股与择时策略评估意义深远,有力推动量化投资技术发展与优化。

以下为报告节选内容

报告共计: 22页

中小未来圈,你需要的资料,我这里都有!返回搜狐,查看更多