【量化公开课】量化研究的逻辑演绎和常见错误

  有一个指数,投资策略非常有效,却被指数公司摘牌;而另一个指数,策略实现存在严重的错误,却被广为推荐。量化研究存在一定的误区。如何从直观上的投资经验开始提炼投资逻辑,并最终推演为有效的量化投资策略?如何避免模型开发存在明显的逻辑漏洞,以至于输钱时还一无所知?

  10月底,由经济金融网主办,北京大学量化交易协会(QTA)协办的量化公开课系列课程第十三讲,在北京大学汇丰商学院举办。本讲课堂特邀中国量化投资俱乐部理事刘钊博士作为主讲嘉宾,为现场听众分享了量化投资的逻辑和常见错误。

  刘钊先生是中国科学技术大学金融工程专业博士,深交所博士后,中国量化投资俱乐部理事,拥有丰富的量化投资经验。他曾任摩根士丹利华鑫基金助理总经理、数量化投资总监,管理大摩多因子、大摩量化配置、大摩量化多策略三只公募基金,最高管理规模超过 100 亿元。其中,大摩多因子曾荣获 2014 年《中国证券报》“三年期开放式股票型持续优胜金牛基金”奖、 2015 年《中国证券报》“三年期开放式股票型持续优胜金牛基金”奖、东方财富网“2014 年最受欢迎基金”奖等多个金融类奖项。

 

  首先,刘钊博士从方法和理念方面入手介绍,建议听众在面量化对模型和现象的时候该如何思考。刘博士指出,他在公募基金的五年见证了量化基金从“被市场所误解”到“被市场广为接受”的过程,这一段历史见证了量化投资在中国的发展轨迹。他进一步以申万活跃指数为例阐述了量化投资应该如何利用市场趋势,制定有效操作策略:该指数在朋友圈被评为最差指数,在2000年深交所挂牌推出,从一开始1000个点掉到现在10个点,跌幅达到99%。碰到这样一个指数,对量化来就出现了商机,指数买的时候卖,指数卖的时候买,反向操作的话指数涨100倍。

  接下来,刘博士简要介绍了流动性的度量方式及非流动性因子的计算过程。非流动性因子本身属性比较好,因子识别性比较强,用这个流动性因子对股票进行分类,可以对股票以因子流动性大小为度量从高到低排成10个等份。他阐述道,每个等份都是一个小的股票组合,对数据进行一段时间的积累,十等份的组合收益的情况很严格的遵循着单调性,因子越小的组合超额收益越多,因子越大的组合超额收益越少,这样的分布非常具有区分度,因子识别性极强。申万活跃指数就是刻画流动性的指标。现在世界上大多数基金都是依据多因子模型来进行管理。

  对此,刘博士讲解了如何用价值因子等因子进行投资的方法及价值投资理念建模的四个步骤。他指出,利用市盈率开发的策略,投资效果明显高于沪深300指数。以低PE策略为例,从05到10年,沪深300收益为210.15%,低PE为263.70%,预期PE为374.03%,动态预期PE为434.45%。那么,如果利用追涨和抄底因子实现的策略,也就是动量与反转因子,投资者在中国的市场条件下就能取得较好的收益。具体而言,他谈到一组数据,沪深300收益0.72;市值加权每月追涨收益0.91;市值加权,每月反转收益2.36;市值加权,每月涨幅居中股收益6.95。

  在谈及多因子模型的整体时,刘博士指出,因子方法在10年初从美国引入,实务界和学术界的差异导致,有时候学术界更强调模型的优势,而实务界更强调精简实用。刘博士建议大家从多因子入手接触量化。

  随后,刘博士介绍了量化投研的几种常见错误。他举出了“昨日连版”(选取昨天连续涨停的股票,等市值(1%)配置权重)这样一个看似优秀的指数所反映出的问题:1.交易不可实现性:一字型涨停股票,例如,由于政策利好而涨停的股票难以买到;2.幸存者偏差:只统计了涨停封死的股票,没有封死的没有统计。

  刘博士还提到了某网站出售的量化策略,胜率高达100%,而九个月后则表现糟糕。其原因在于,过度拟合导致量化策略在样本集中表现良好却无法对新的数据进行有效的拟合。同时,使用未来数据、统计样本少都是在模型构建中出现的常见错误。

  那么,如何在避免量化投资常见错误的情况下,制定好的量化策略呢?刘博士提出了好策略的几个前提:

  一、逻辑上:逻辑清晰可理解

  二、参数上:参数不宜过多,或者不依赖参数

  三、大概率:持股数量多

  刘博士提到,一个好的量化模型是分了很多步骤最终变成一个基金产品。针对模型开发过程,他给出了详细的流程说明:

  1.策略收集:通过与基金经理以及业界同行的沟通,参阅学术论文,收集学术派和民间派的各方观点,形成信息汇总,找出可行的备选策略。

  2.模型精选:建立一致的系统平台进行回测,检查分析模型表现。

  3.筛选备用模型:模型的入选必须满足,至少有三个月运行期限、在样本外测试有良好的表现、与其他模型相关性低等条件。

  4.实际产品:在模型投入使用后,应定期生成产品以及模型的表现及风险报告;模型评估委员会每月定期对已使用以及在研究的模型进行讨论;投资决策委员会每月定期对产品事宜进行讨论,议题包括但不限于模型比重分配以及股票仓位等。

  最后,刘博士指出,每个量化团队都有若干模型。阿尔法模型以及CTA模型等等,量化是一个非常庞大的体系,往往需要整个团队的配合。因此做一个好的量化策略,不仅仅需要个人的努力,更应发挥团队的优势。对于中国量化的前景,刘博士持乐观的态度,鼓励同学们多多尝试学习,为今后的量化策略开发之路打下坚实基础。

(撰稿:张世杰、王雨萌 编辑:金颖琦)