×

【两融】基于随机森林的多因子选股模型构建——金融工程专题报告

hqy hqy 发表于2025-07-03 16:37:55 浏览2 评论0百度已收录

抢沙发发表评论

来源:渤海证券研究

王雪莹 证券分析师

SAC No:S1150525020001

多因子模型与随机森林介绍

多因子模型通过选取一组影响资产收益率的因子,并建立因子与收益率之间的数学模型,来解释和预测资产的收益率,应用于复杂多变的金融市场时,常因其对市场关系的线性假设而显得力不从心。随机森林模型无需预设因子与收益间的函数关系,而是通过算法驱动的方式,自动学习和发现数据中隐藏的复杂结构,通过集成大量决策树,能够精准捕捉非线性关系与高阶交互作用。将随机森林等机器学习模型应用于多因子选股,是传统量化投资向“AI量化”升级的典型路径,能够穿透市场表面的噪音,从高维、非结构化的数据中解构和识别复杂的非线性模式、捕捉转瞬即逝的市场微观结构特征,并构建能够动态适应市场环境变化的自适应模型。

模型构建

模型构建中选取了包含估值因子、成长因子、质量因子、杠杆因子、市值因子、动量反转因子、换手率因子、技术因子等八个类别的25个基本面和技术面因子。将2010.1.4至2025.4.30整个时间段的后40%作为回测区间,前60%的数据中,80%作为训练集,剩下20%作为测试集。选取中证500指数成分股作为基准股票池,每20个交易日进行一次调仓,每次选择10只股票持有,先后进行了特征和标签提取、数据预处理、训练集和测试集的合成、模型训练和模型回测步骤。

结果显示,随机森林模型大幅跑赢了中证500指数。从收益指标来看,随机森林模型的总收益率、年化收益率、Sharpe、Calmar等均高于基准,波动率和最大回撤都低于基准,风险收益比远好于基准,说明经过历史数据的学习,随机森林模型具有更优异的选股能力和更稳定的表现。随机森林模型凭借其强大的非线性建模能力和抗噪性,在多因子选股策略中实现了更优的风险调整后收益,验证了机器学习方法在量化交易中的实用价值。

模型基于历史数据构建,存在失效的风险,不构成投资建议;第三方数据不准确的风险。

以上内容来源于渤海证券研究所2025年07月01日发布的证券研究报告《渤海证券研究所晨会纪要》

重要提示:

通过本公众订阅号发布的观点和信息仅供渤海证券股份有限公司(以下简称“渤海证券”)客户中符合《证券期货投资者适当性管理办法》规定的专业投资者参考。因本订阅号暂时无法设置访问限制,若您并非渤海证券客户中的专业投资者,为控制投资风险,请您取消关注,请勿订阅、接收或使用本订阅号中的任何信息。对由此给您造成的不便我们表示诚挚歉意,感谢您的理解与配合!

本公众订阅号(微信号:gh_dac6364916ed)为渤海证券股份有限公司(以下简称“渤海证券”)研究所依法设立、独立运营的唯一官方订阅号。其他机构或个人在微信平台上以渤海证券研究所名义注册的,或含有“渤海证券研究”,或含有与渤海证券研究所品牌名称相关信息的其他订阅号均不是渤海证券研究所官方订阅号。

本订阅号所载内容仅面向符合《证券期货投资者适当性管理办法》规定的专业投资者。渤海证券不因任何订阅或接收本订阅号内容的行为而将订阅人视为渤海证券的客户。

本订阅号不是渤海证券研究报告发布平台,本订阅号发布的观点和信息均来自于渤海证券研究所已正式发布的研究报告,如需了解详细的证券硏究信息,请具体参见渤海证券研究所发布的完整报告。

渤海证券对本订阅号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本订阅号中资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据渤海证券后续发布的证券研究报告在不发布通知的情形下作出更改。渤海证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本订阅号中资料意见不一致的市场评论和/或观点。