陈烨:多因子投资目前处于蓬勃发展的时期

1评论 2016-12-08 21:40:25 来源:金融界网站 抢反弹最强涨停战法出炉!

  金融界网站讯 华泰证券(行情601688,买入)2017年度策略会于12月7-8日在深圳举办,本次会议主题为“通权达变,通南彻北”。上百家上市公司高管,众多中外顶级机构投机者出席盛会。

华泰

  华泰金融工程分析师陈烨表示,多因子投资目前处于蓬勃发展的时期。首先,国内量化基金的发展十分迅猛。量化基金不仅最近规模发展比较好,业绩也表现的非常不。陈烨认为以多因子为代表的截面投资是未来发展的趋势,尤其是散户为代表的。

  以下为文字实录:

  摘要:量化管理基金发展迅猛,在业绩上国内遥遥领先,且总量发展迅猛,未来基金的管理,量化有着良好的前景。而量化里面最成熟的理论当属多因子模型,也是现在能提供长期回报的模型。多因子模型最关键的一步在于因子库的构建,这些我们都有所尝试,并且在进一步完善我们的因子分析。进一步的,我们用因子对资产的风险和收益进行预测,以提供交易指导。下一步,我们准备完善因子归因模型和超市Alpha因子策略,并可能用一些非线性的方法结合我们组的其他研究,自上而下地完善业绩归因体系。

  主讲人-陈烨:在座的各位老师,大家好!我是陈烨,是华泰金融工程研究员,前面五位大佬都讲得太好了,到我这儿就讲一下我们组的研究规划,希望能给我们组开一个好头。我就开始我的演讲。

  我的主旨是多因子投资目前处于蓬勃发展的时期,我们华泰证券金融工程组也在多因子选股方面有一定的研究规划,下面开始我的介绍

  首先,国内量化基金的发展十分迅猛。从全球来讲,美股市场里面第一只量化公募基金于1978年,上世纪80年代在美国蓬勃兴起了这样一股量化的风潮,到我国国内的话,量化是一个泊来品,国内第一只量化基金是2004年成立的,2005年摩根成立了Alpha组合的资金,刚开始量化资金的发展是比较缓慢的,在2011年的时候全市场可能只有10余只量化公募基金,到2013年的时候全市场已经有100只左右的量化公募基金了,到2014年底的时候,全市场已经有300余只量化公募基金。仅2016年年初到11月,就成立了28只量化基金,这个水平已经超过了2004年到2011年整个七年时间的量化资金总额。量化基金的总规模在三季度的时间已经接近800亿元了。

  大概今年11月初左右的时候,我们统计过最近一年所有的偏股型混合基金的业绩,发现排第一名的是一支量化基金,就是最有名的长信量化先锋爱基,净值,资讯。我这里举长信量化先锋的例子,他的份额从2010年开始一直到2014年之前都没有太大变化,2014年之后这个份额取得了突飞猛进的增长,基本上展示了指数型增长的趋势。

  量化基金不仅最近规模发展比较好,业绩也表现的非常不错,因为首先量化基金的数据收集起来稍微有一点困难,所以我们也在几大证券报纸、万德数据库以及比较有公信力的网站上面搜索了很多数据,所以这里举了中国证券报2016年11月中旬的一个刊物,上面列举了一个主动混股型基金对比,全市场主动混股型基金平均收益率11%,但是量化基金达到近20%,近一年量化远超市场平均收益率,近五年量化基金收益也非常猛,已经超过100%。以沪深300指数为基准,近一年量化基金的平均信息比率为4.76,然而同业平均0.81。

  我们拿长信量化先锋基金作为例子,沪深300指数作为基准,可以发现下面还有一些统计数据。近五年的收益已经达到了200%,据我搜集的数据看,近五年超过500的是长信量化先锋和大摩多因子,量化基金不仅是最近这段时间业绩有优势,长期业绩也非常有优势。截止到2016年11月,把一些指数和分级基金去掉排名,偏股混合基金里面有8个是量化基金,近一年收益排行榜前面普通基金是5个量化基金,偏股也是5个量化基金,近三年前二十名中也是有4、5个是量化基金。因为量化基金发展历史没有那么长,所以这张表还是非常能反映量化基金发展的趋势。

  据大家的估计,现在量化基金在全市场公募和阳光私募占比约5%-10%,这个数据不一定准确,也是大家的估计。再看前20名中量化基金的占比,基本上都能超过20%,最低的也达到20%了。所以从一个角度能够说明国内量化基金的业绩其实是表现非常不错的,在同业当中表现非常不错。

  从量化基金转到多因子,我这个题目这样来转其实是不生硬的,因为众所周知,量化领域理论发展最健全、发展历史最悠久、最确定能够产生收益的模型几乎就是多因子模型了,不敢说是唯一的,换一种说法,多因子模型是一种确定能够产生长期稳健收益的模型。

  近半年涨幅前十的量化基金里面,有九只都在招股说明书中说到采用多因子模型,采用市场流动性是提及最多的因子。这是中国证券报这种官方报纸上摘的例子,泰达宏利改革动力基金,利用多因子模型结合市场热点进行创新,使用国企改革、并购重组等因子,结合估值、成长、盈利质量、情绪等因子,以自上而下的视角精选优质股票。还有一个是九泰久盛爱基,净值,资讯量化先锋基金,最近也是拿到30%多的回报。

  我们认为以多因子为代表的截面投资是未来发展的趋势,尤其是散户为代表的,中国大部分投资者都是观察个股时间序列的趋势,可能有一些波浪理论等等,这是散户最喜欢的理论,根据时间序列的发展趋势去决定在什么时候入场、什么时候卖掉,这样来获取收益,本质上是从时间序列的维度上面来发掘获利的空间。晓明总最近推的经济周期模型就很牛了,本质上也是从时间序列上面挖掘趋势的。像一些行业轮动爱基,净值,资讯和择时、交易类模型,本身都是观察时间序列来挖掘这个规律的。比如说设置月度的模型,我们会综合评判因子在当前平面的得分,依据个股在所有得分的排名得出这个股票,本身逻辑和时间序列投资不一致,它是一个在时间截面上比较个股而进行投资。还有现在市场上比较具有代表性的基本面选股模型,其实也是截面投资,比如说高股息率模型,因为在某个月或者某个时间点,也是在每个月上面进行个股选择,我们认为截面投资需要依赖一定投资数据,绝大多数的散户的技术水平有限,可能不太适合发掘到截面上的规律。基本上时间序列你打开万德,直接拉出来一只股票就可以自己数几波几浪了。但是截面投资起码还要开Excel把所有股票因子值下载下来才能比较,所以门槛偏高。所以我们认为在A股市场量化发展的一片蓝海中,截面投资是趋势中的趋势,所以我们后面主推多因子选股模型。

  讲了这么多量化的发展趋势,具体讲一下我们华泰多因子模型研究的框架。

  首先,我们9月21号的时候已经发表了一篇《华泰多因子模型体系初探》的报告,我认为目前是对多因子描述最成体系、最详实,每一个细节都描写清楚的报告,非常适合各种层次的投资者过来阅读。如果您是入门级的投资者,看了我们的报告之后基本上自己可以实践多因子模型的框架,如果是多因子资深的研究员,那您看了我们的报告之后,也可以发现与您的处理方式有哪一些不同。

  简单介绍一下这个框架,首先是因子筛选,这肯定涉及到一些数据库的构建、清洗、数据标准化等等。因子筛选,我们通过了分层测试、IC值分析、回归分析等方法进行因子识别。目前发布了单因子测试系列报告,我们往白皮书方向发展,因为多因子报告是我个人主做的,非常详细,每篇报告大概50页报告,如果您对多因子感兴趣,欢迎阅读我们的报告,可以从不同视角看一下别人是怎么看待多因子的,可以给您提供不同的想法。

  进行因子筛选之后,然后进行收益预测。我们首先进行因子合成,有人把这一步略过去,我们是做了这一步,我们举了具有贡献性的因子,这里有很多,我们先把同属于同一个大类的,比如说估值类或者动量类,首先根据一些方法,也有很多可以参考的方法,我们先进行合成,当合成十个左右的风格因子之后再进行多元性回归,根据多元回归的结果,风格跟多元回归能产生因子的历史收益率,我们预测因子下一期收益率,根据因子的暴露来预测。后面也是根据因子的历史收益率结合当期个股的相关残差风险来做预测。

  有了收益预测之后,我们要做优化选股。比如说行业中性、市值中性或者其他风格中性,再加上其他的约束,这就是完整的多因子选股模型了。如果您进一步想挖掘多因子究竟哪个因子上面获利最多,就可以构建业绩归因模型,业绩归因模型我们也有详细的报告,希望会后可以提供报告给大家。

  众所周知,多因子模型最关键的一步是因子库构建。我们因子库主要分十二个大类,目前包含70多个细分因子,大概说一下因子库主要包括哪一些。第一个是估值因子,这个不多说了,主要是PE、PB等等。后面主要是成长因子,主要是营业收入、净利润、roe的当季同比增长率。财务质量因子主要是ROE、ROA、杠杆因子、规模因子,还有动量因子。波动率因子是过去一个月日收益率的波动方差。换手率因子是过去N个月的换手率,这里有一个改进动量因子,过去一个月中每日的收益率加1再相乘,形成一个月反转因子。改进的动量因子是用过去的一个月换手率,每日收益率和每日换手率进行加权平均,如果今天换手比较大,今天收益率权重大一点,这个用了“放量涨跌”的概念,这样改进的动量因子算下来比一个月反转更好一些,这是我们推荐的因子,接下来会发动量的单因子报告,欢迎各位老师关注。股东因子是持股比例的变化规律。分析师情绪因子目前还是用万德的,上调、下调的加速和万德预期等等。技术因子是非常大的因子,目前我们有这一块规划,但是没有很多,仍然在开发中。

  接下来介绍一下单因子测试框架。行业间的差异不用多说,肯定存在,不同类别的因子跟市值因子的相关性差一些,我们测的估值因子和市场因子相关性差一点,成长因子跟财务因子相关度多一点,各个相关的因子两两之间还有分析。这个分层回测我们做的比较细,一个因子、一个因子的做的。这个IC值因子,我们看了之后做了一个表。通过回归分析,可以看到因子分了五层或者十层,这五层或者十层是上升还是下降,回归分析里面已经做了一个假设,你是先假设它有关系,然后再进行回归分析,看拟合优度等等,所以这个分层分析确实比回归分析多提供一点因子单调性分析,而且比较直观,这里面故事比较多,我们测试的比较细。最后把三种结果进行总结。

  先给大家看一下我们的回归模型(见PPT),我们用的回归模型是这个因子本身,加上一级行业哑变量,如果每个股票被完美的分到一个行业里,一级行业哑变量就等于一个解释变量。使用这个回归模型的话,我们除了去看单因子前面回归的斜率,还可以这个斜率对应的t值,这个斜率是不是t等于0,如果t绝对值大于2,证明这个因子在本期解释力比较显著,前面的因子回归系数是显著的易于零,对下期收益率具有解释作用,我们也用梯级系列的指标来解释这个合理性。

  因子IC值原始的定律是这个因子在股票之间的相关系数,因为我们对IC值进行调整,我们先作为行业哑变量和行业回归量,这样可以消除行业因素对市值因素的影响,消除之后行业无偏和市场值无偏,这样算,IC值是剥离了行业因子和市值因子的一个有效性。

  后面是分层测试法(见PPT),这个分层测试法其实挺有意思,分层其实很困难,因为首先要构建行业中性的分层组合,就要首先在每个行业里面分层,再把不同行业间的组合一、组合二、组合三拼在一起,然后根据沪深300进行配比,然后形成组合。举个例子,行业一如果有5个股票,分三层怎么搞,你当然可以说分层组合一里面一个,组合二里面两个也搞定,如果分十三层怎么分?这是很纠结的问题,我这也是自己开脑洞,想了一个可以被接受的解决办法,先假设每一个个股有初始权重,如果没有偏好,初始权重为1,五个个股累积权重是5,如果断在三分之五,于是组合一里面个股1和个股2的配比是3:2,我们如果做行业中性,全市场就完成了行业市场的分层。这样分层的好处,正着分和倒着分是都可以的,我们依据这样的分层法进行测试。

  因为测试在报告中有详细的描述,所以这里举了这个图片作为例子,大家先看下面的表格三(见PPT),这个表格三是我自己截的一个图,这个图是分层测试结果的汇总。我举了两个估值因子和两个成长因子作为例子。估值因子用的是BP和SP,这里面是取了倒数,后面两个成长因子是净利润的当期同比增长率和ROE同比增长率。我们看后面TOP组合的夏普比率,可以看到一些信息。后面的多空组合,可以看分股层的组合,我们看这样一个多空组合年化收益率,可以看到BP因子达到14%,其实BP因子从统计意义上讲确实是不错的因子,其他三个ROE当天同比也都是在6%左右,所以纵向一比较,BP因子统计效应确实非常猛。然后再看上面的图,这张图其实是回归法的结果,我们回归在每一期截面进行单因子测试,然后再回归模型,就是看因子值的向量,加上一级行业哑变量,每一期因子都会产生量变去除,按照月度每一期的月度回归系数在一起,这个趋势就有很大意义了。如果这段时间走的比较振荡,就是这段时间没有提供什么收益率,如果发生了回撤,那是最不愿意见到的情形。这样一个因子,我们看到BP和SP表现比较相似,毕竟都是估值类的因子,在09年中之前这个BP和SP因子的累积速度都是相当于累积的又快又好,比较平。但是从09年中到2013年中,市场风格发生了一些切换,这时候估值因子一直走得比较平,总体来看有一点波动。但是注意看下面两条灰色的成长因子,恰恰就是在估值因子走得比较平的那一截,成长因子累积的又快又好,说明这段时间市场风格发生了一些切换,这段时期就是上是属于熊市结束的后期加上牛市还未开始的初期。在这样一段振荡式的时期,成长因子就比较有利,估值因子跟成长因子比就可能稍微逊色一点。

  最近一段时间成长因子好像也还是有一些用,估值因子也是,但是波动可能稍微大一点。具体来说,如果多因子模型做的更精细一点,可以做因子择时,每一段时期做不同的因子。因为因子做好也不太容易,有不太确定的风险,所以这也是我们未来的尝试方向,我们后面会尝试因子择时的方向。

  我们目前在推单因子测试系列,所以单因子测试系列推完之后,后面马上会推风格因子的分析和合成系列,用一些等权法、历史收益率加权法、最优比例加权法等等尝试进行风险因子合成,不同的方法还可以去比较,看到底哪种方法才是更优秀、更稳定、更适合目前的市场行情。在这个风格因子的合成与分析过后,前面也讲了,我们今天就可以去一些比较细节的方式进行收益预测,这个收益预测也是有是风格因子的历史收益率,直接用过去一段时间历史收益率的均值,比如说用一些模型进行预测,方法还是有很多的,将来也会讲得更细一点。这一页PPT上的内容,在我们首篇报告中已经有比较详细的论述,如果您感兴趣,可以参考我们的报告。

  收益预测之后是风险预测,将个股风险转为风格因子的风险预测,这样转化为因子风险预测之后,既提高了准确性又降低了计算难度,这也是多因子的精髓,做完之后进行优化选股,这也是控制风险最大化收益,控制收益最小化风险,结合收益与风险惩罚项作为优化目标等等,我们准备尝试一下构建不同风格的多因子模型。这是一系列比较常规的研究计划。

  更远期的,我们准备挖掘优秀的Alpha因子,这也是竞争比较激烈的,因为各家比较成熟的Alpha模型,基本上细节大家做的比较周到,市场上面能够利用的数据工具和专门开发多因子模型先进的工具也都比较完备了,所以现在竞争的热点已经转到挖掘Alpha因子上面了,所以我们也是准备随时关注国内外先进的研究成果,随时准备分享给大家。

  后面,优化因子使用方式和选股方法,这两个比较像,因为都是用线性模型,其是打分法也是一个线性的概念,但是目前比较热门的机器深度学习等等,其实都是用非线性的一些思想来处理因子。最近比如说一个非常风靡的概念叫fintech,用金融科技来改变选股方式,我们也打算进行这方面的一些尝试。最后就是构建业绩归因体系,这个环节我们已经在尝试中了,未来希望能够开发一个比较完备的,结合我们组其他研究,关于周期研究、板块研究、大类资产研究等等,我们构建完整的自下而上的业绩归因体系。

  非常感谢今天大家聆听我的报告。谢谢大家!

关键词阅读:华泰证券策略会 陈烨

责任编辑:雷玮
快来分享:
评论 已有 0 条评论
资金流向马上开户

资金查询:

证券名称最新价格涨跌幅净流入金额(万)
宁德时代69.1510.01%48947.46
风华高科13.557.71%30776.78
兴瑞科技30.6510.01%20359.71
大烨智能20.589.99%10185.85
研报评级

资金查询:

更多>>
股票简称投资评级最新价目标价
徐工机械买入4.09--
格力电器买入38.95--
上汽集团买入29.15--
伊利股份买入24.20--