【量化公开课】量化投资的是与非

  随着量化投资逐渐被广大投资者所认识,它的神秘面纱被慢慢揭开; 但是大家说到量化投资,提到的似乎无非是量价指标,技术分析,程序化交易。或者时髦一些的机器学习,人工智能,神经网络等专业名词。那么量化投资到底是不是就是在一大堆数据里找规律? 量化投资的过程中究竟有何是与非?

  2017年10月10日,经济金融网主办、北京大学量化交易协会协办的“量化公开课”第十一讲上,深圳嘉石大岩资本投资总监季渊先生做了“量化投资是与非”的专题讲座,生动形象地结合学术理论和实践,介绍了国内外量化投资现状和策略研究方法,以及公众对量化投资可能产生的误区。

  季渊毕业于上海交通大学获计算机学士,后赴美国加州大学尔弯分校攻读工学硕士,现任深圳嘉石大岩资本管理股份有限公司投资总监。在加入嘉石大岩资本前,他曾任美国微软公司(Microsoft) 软件开发工程师、美国JASPER资产管理有限公司系统研究员、美国高盛集团(Goldman Sachs)资本交易部副总裁。在高盛资本交易部,他曾参与设计及开发通用交易平台,独立开发平台配套自动测试程序,并参与完成了程序化交易、期货期权交易、手动交易等一系列交易算法在该平台上的应用实现。

  在讲座的开始,季渊先生首先谈到了对投资的正确理解,即投资是用未来的风险来交换未来收益的过程,广义上买股票、买国债、买彩票和赌博都可以定义为一种投资。判断投资好坏的标准应当综合考虑收益和风险,而不应该只从收益这一单方面考虑。季渊先生特别提到,在量化交易已经非常成熟的美国市场,五年以至十年的夏普比率几乎是评判一只对冲基金业绩好坏的唯一标准。

  关于量化投资中的数据分析问题,季渊先生从空域、时域、频域三个角度分别进行了阐述。从空域的角度,季渊先生以美国超级碗(super bowl)比赛和次年道琼斯指数收益为例。数据表明,美国美式足球联盟(AFL)获胜则指数下跌,国家橄榄球联盟(NFL)获胜则指数上涨的规律,在过去25年中惊人的80%切合率(只有5年不符合)。然而,这样的数据规律是不符合经济逻辑的,我们在做量化投资数据分析时应规避这种偶然现象。 

  从时域的角度,季渊先生谈到了,量化投资致力于用过去的数据寻找规律并用于未来的投资之中,所以我们必须要思考所谓的规律是否在未来具有延续性。而从频域的角度,他谈到了数据的选取,我们一般选取60日均线,过去1年业绩这样的整型频度进行数据分析,而不能纠结于选取59日均线,过去13个月业绩这样的非直观数据吗,以达到更好数据处理效果。

  然后,季渊先生以本福特定律( Benford's law) 为例向大家展示了一个科学的量化投资过程。该定律说明一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍。比如,一个公司的年度账目数据应当是满足这一定律,经济学家可以据此查找出伪造数据。

  依据这一定律,他们发现了2004年美国总统选举中佛罗里达州的投票欺诈行为,2004年委内瑞拉的投票欺诈和2006年墨西哥投票欺诈。推及至量化投资领域,一个量化投资模型应当假设清晰,逻辑为先然后需经过严密的推理和详实的数据验证,将科学实证和经验、常识、感觉相互融合。 

  最后,季渊先生谈及量化投资的局限性。量化投资的优势在于规避人的感性行为,然而人又必然要决定一个模型如何使用。其他局限性还包括无法数据化具体的经济事件,同质化的量化投资会造成雪崩效应等。在观众提问环节,季渊先生耐心地回答了现场听众关于人工智能与量化投资关系,如何从传统价值投资向量化投资转型等问题。

(撰稿:刘港琛、周宇进 编辑:金颖琦)