在上一篇文章中,我们详细讨论了各类基金的风险和回报,以及不同风险承受者适合购买的基金类型。其中,针对中高风险投资者,我们建议用户可以购买股票型基金,不建议用户购买股指型基金,因为承担同样的风险,股票型基金的收益率明显更高。而390支股票型基金里面,高收益低风险的基金有89支,占比23%,这个比例还是相对较高的。那如何购买到这部分基金呢?本文试着从一些维度来分析好基金具备的一些特质,这也是时到量化希望解决的核心问题之一,我们认为这是一件很有意义的事情,希望和大家一起在有限的时间做有意义的事情。
因为债券型和货币型基金的收益和风险均相对较小,研究的空间并不大,而FOF基金的样本数较少,研究结论不能作为普适的结果,所以本篇研究的重点是混合型基金,股票型基金和股指型基金,我们从这3类基金里面筛选出股票仓位大于50%且成立时间超过3年的股票,一共2146支,这是此次研究的样本。
一. 基金经理工作年限的影响
众所周知,基金经理对基金的业绩有直接影响,因此,我们首先从基金经理这个维度来分析,先看基金经理工作年限和基金业绩的关系。
我们先对2146支基金进行数据清洗,除去近3年变过基金经理的基金,还剩下945支基金,然后对这些基金近十年的平均收益率和基金经理工作天数画出散点图,如下图1
图1
从上图可以得出如下结论:
1.工作时间越长的基金经理,业绩越稳定。
图一中,工作3-5年的基金经理,年化收益率范围集中在 -10% -
30%,而工作5-8年的基金经理,业绩范围集中在 0% -
20%区间。
2.工作时间长短和业绩没有正相关性。
从图一可以明显看到,并不是基金经理工作时间越长,业绩越高,只是业绩越稳定。
二. 夏普率和基金业绩的关系
不少资深投资者会在选择基金的时候,会参考基金的夏普率。夏普比率越大,说明基金单位风险所获得的风险回报越高,但夏普比率并非是越高越好,具体选择还要参考投资人的风险承受能力,换句话说,在相同风险下,夏普率越高代表该基金过去的表现越好,不同风险下,夏普率不能直接对比。
举个简单例子,假设某只债券型基金A的波动率是1%,收益率是5%,则夏普率是2,另外一只股票型基金B的波动率是20%,收益率是33%,夏普率
= (33% -3%) / 20% = 1.5。
A基金的夏普率高于B基金的夏普率,但是,如果投资者愿意承受20%的年波动率的话,那么他选择基金B,能获得年化33%的收益率,而如果他选择基金B,则只能获得年化5%的收益率。
从上面例子可以看出,我们在选择购买某只基金的时候,不能简单的用夏普率排名来选择基金,因为各基金的风险并不相同。那聪明的投资者可能会问到,如果几只基金的风险大致相同,在选择要购买的基金时,是不是夏普率越高越好呢?对于这个问题,我们先不直接给答案,我们来用历史数据做一个回测,看看结果如何。我们从2013年至今,随机选择一年,比如选定2017年,2017年所有偏股型基金计算出前3年的平均夏普率,然后全部买进这些基金,持有一年,再看一年后这些基金的收益率如何,我们能画出如下散点图:
图2
如上图3所示,基金过往夏普率的高低和基金未来的收益率没有明显关联,也就是说,如果以某基金前三年平均夏普率高低为依据来选择基金,持有一年,并不意味着能获得较高收益。可能有些爱钻研朋友会说,这只是一年的数据,不能支撑上述结论,这是一个非常好的质疑,我们也完全认可这个质疑,所以我们对偏股型基金近十年的历史数据都进行了上述的回测,得到10张如图2类似的散点图,然后我们再对这10张图的结果进行皮尔森统计,得到结果如下表所示:
|
2013年
|
2014年
|
2015年
|
2016年
|
2017年
|
2018年
|
2019年
|
2020年
|
2021年
|
2022年
|
R值
|
0.25
|
-0.22
|
0.047
|
-0.13
|
-0.04
|
0.06
|
0.045
|
0.23
|
-0.029
|
-0.28
|
P值
|
6.53E-05
|
3.28E-05
|
0.32
|
0.0029
|
0.32
|
0.12
|
0.18
|
3.01E-14
|
0.3
|
9.01E-32
|
相关性
|
正相关
|
负相关
|
无相关
|
负相关
|
无相关
|
无相关
|
无相关
|
正相关
|
无相关
|
负相关
|
表1
从表1可以得知,某只基金历史夏普率的高低和该基金未来收益率的好坏没有明显相关性,这也再一次证实了,不能用历史数据来预测未来行情。
基金的夏普率,能对同类基金的历史业绩和风险做一个明确的量化评估,但无法预测未来收益,因此,不能简单的直接用夏普率的进行选基,而要综合多个因素去选择合适的基金。
三.
基金市盈率对基金业绩的影响
市盈率对股票而言是一个比较重要的指标,市盈率 = 股价 / 每股收益(年)。股票的市盈率高低,能直接反映该股票的股价是否被高估或者低估,因此,这个指标被很多股市投资人所重视,巴菲特对该指标也尤为重视。因为偏股型基金也持有大量的股票,所以我们可以根据偏股型基金持有的股票的市盈率对股票而言是一个比较重要的指标,市盈率 = 股价 / 每股收益(年)。股票的市盈率高低,能直接反映该股票的股价是否被高估或者低估,因此,这个指标被很多股市投资人所重视,巴菲特对该指标也尤为重视。因为偏股型基金也持有大量的股票,所以我们可以根据偏股型基金持有的股票的市盈率,计算出该基金的市盈率。计算出该基金的市盈率后,我们可以根据这个值计算出该市盈率在历史全部市盈率的相对位置,然后再看这个相对位置和基金的业绩有无关系。根据这个思路,我们从上述2146个基金种随机找出100支基金,算出近十年的市盈率百分比和基金业绩的关系,结果如下图所示:
图3
从上图可见,这100支基金的市盈率百分位平均值(绿色曲线),十年间呈现一个显著的波动走势,且该波动和基金净值平均值曲线(蓝色曲线)的波动大致吻合。
所以,我们可以根据基金的市盈率百分位相对位置,来判断该基金目前的状态。例如,当该基金的市盈率百分位超过历史90%的时候,那么该基金可能被高估了,同理,如果该基金的市盈率百分位处于低位时,则该基金可能被低估了,高估的时候可以选择不持有,低估的时候可以选择持有。时到量化在对基金进行择时的时候,也同样参考了该值,欢迎大家在基金详情页回测验证。
四. 个股集中度和收益、风险的关系
本节内容我们探讨偏股型基金持仓股票的集中度和基金的收益,风险之间的关系。首先我们对符合基本条件的4537支偏股型基金进行持仓股集中度的统计,如下图4:
图4
从上图4可知,4537支偏股型基金持仓股前十仓位占比大致符合正态分布,前十持仓股占比大部分在40%-60%之间。我们对再看持仓股集中度和收益,风险的关系如何,如下图5:
图5
由上图5可知,前十股票持仓集中度和基金的最大回撤有明显的相关性,达到0.32。为验证这一点,我们也统计了基金持仓股前7,前5,前3占比的集中度和最大回撤之间的关系,从上图可见,也具有明显的相关性,和收益率,风险没有明显相关性。为了解前10持仓股集中度和回撤的具体关系,我们做了进一步的分析,如下图6:
图6
如上图6所示,横轴是基金前10持仓股占比,竖轴是最大回撤。可见,当前10持仓股占比越来越高的时候,最大回撤平均值也越大,见上图中间的红线,最大回撤平均值由约18%(0.18)上升到约30%(0.3)。另外,最大回撤的幅度也越来越大(见上图上下2条红线),说明基金业绩的不稳定性也越来越大。
五. 总结
整体而言,虽然基金的业绩受多个因素的影响,是一个较为混沌的系统,但我们仍然可以找到一些因子和基金的业绩有明显的相关性,让该混动系统的部分子系统略为有规律。因此,结合相关因子,我们可以用概率或者大数定理的方法降低风险,提升收益。如上面研究思路,我们利用相关因子,在基金的收益和风险维度,找到相对优质的基金,组建一个优质的基金池,然后随机在基金池种购买10-20支基金,便能拟合该优质基金池的整体收益率。但要提前说明的是,我们的研究方法基于历史数据,众所周知,历史数据并不能完全代表基金将来的业绩,所以该方法存在一定的局限性,但仍不失为一种有效的策略。最后,我们给出的优质基金池仅仅是我们自己的研究结果,仅作为学习,交流分享用途,不作为投资依据,投资有风险,大家需谨慎。