本文共 4991 字,大约阅读时间需要 16 分钟。
随着人工智能以不可阻挡的态势渐渐渗透到我们日常生活的方方面面,在高度量化的金融投资领域,变革求新、提速高效的追求也催生了智能投顾作为AI全新产品的蓬勃发展。大量的金融科技、人工智能相关岗位的招聘和交易员、量化研究员岗位的消失正见证着这一AI新业态随着时代发展的崭新面貌,那么在着手构建智能投顾产品具体操作的过程中,该如何去建立核心模型这一“心脏部位”去投入运行?雷锋网AI金融评论与AI慕课学院主办的智能投顾配置特训班讲师王蓁特别指出,智能投顾整体模型的关键在于运算公式的建立和参数的估计。
以下是本次直播课程内容回顾:
今天是初级课程第三讲,今天开始正式来介绍,各个资产配置模型具体的原理,以及我们应该怎么在各个资产配置模型当中,去真正完成资产配置的操作。
今天我们会讲两个模型,第一个模型是美国也是世界第二大资产管理公司—先锋(Vanguard)所使用的资产配置模型。先锋在2016年介入智能投顾行业这个领域,它们的资产配置模型其实是对外采购的,我们先来看看这个资产配置模型的投资逻辑:
第一,假设投资周期是10年,或者更长的时间;
第二,假设投资的是美股的市场,也就是一个震荡上行的市场。为什么第二点这么重要呢?是因为,美股是一个特殊的市场,像定投,或者长期投资,在美股市场是比较有效的;
第三点是假定市场有效,也就是巴菲特一直在说的,所有的投资不如买大盘,所以他们推崇的是被动式投资,做的是大类资产的配置。每一个大类资产配置当中,所选的标的不进行主动式管理,也不进行收益增强,而是纯粹地跟随指数进行增长;
第四点是假定投资不会产生超额收益Alpha,所以说在这个逻辑之下,最大的考虑是降低交易的频率和每一次交易下的交易费用。其实不止交易费用,在ETF和公募基金之间,也会选择交易费用、维持费用比较少的。因为我们知道,共募基金有前端费用、后端费用,还有营销费用、花费费率,以及管理费等等非常多的费用。ETF内部也有维持的费用,但是在考虑这些费用的情况下,一般来讲,ETF要比公募基金要低很多。所以说,他们会选择费用较低、维持成本和交易成本较低的标的来进行投资。
另外,他们采用了人工划分投资者的办法,并且人工选定了投资者的类型,大类资产是什么样的权重,以及通过人工确定,每一个大类下,他们认为的固定的,最优的有代表性的投资标的,也就是ETF。所以第五、第六、第七和第九点,考虑到频率较低(具有可操作性),他们每年都会去做。
同时也是因为是长期投资,所以并不会在乎,今天买到的这个价格,是100元还是101元。
先锋模型,本质就是人工定好每一项大类资产配置,又定好了每一大类资产的投资标的,然后再人工确定这样的组合对应的特征,也就是风险等级,一一对应起来建成几个大框。把这些大框放在一起,用户一来就可以扔进去了。
课件上是一些例子,它们其实是根据投资周期的长短先进行划分,我们在第一节课也提到了,用户风险等级主要取决于两个因素:一个是投资周期,一个是用户的风险承受能力。用户的风险承受能力可以进一步划分为两方面,就是用户的客观风险承受能力和主观风险承受能力。用户从资产端考虑,从最左边到最右边,随着投资周期的增长,股票在里面占有的比例越来越大,债券占有的比例越来越小。下面的表格也写着过去九十年的结果,这在中国是不可想象的。过去九十年的结果就是这样,每一年5%,6%或者7%的收益,这是比较难以想象的。但是我们可以看到,整体来讲,随着投资周期的增长,随着股票占有比例的逐渐增多,波动性加大,风险在提高的同时收益也在提高。
这是先锋另外的一些配置,把用户的需求分为几个大的目标。你是想均衡型的,就看左边的一列;或者是成长型的,就看右边的一列。均衡型要比成长型保守,成长型更加的激进,比如一个刚步入职场的年轻人,先锋可能会认为,他更适合一个成长型的配置。
以上就是先锋的资产配置模型,所有工作都是纯人工去做的,这和国内某知名智能投顾提供商一样。这并不是我们真正想要的智能投顾。它的好处是什么呢?策略原理简单、透明,人工确定了所有的东西,所以你选的人非常厉害,是巴菲特之流,那么你的收益就会很高。交易执行也非常简单,一年一次,不存在调仓的考虑,所需的成本非常低,需要做的工作非常少。
但是它的缺点也非常明显,成也萧何败也萧何。如果你选的是巴菲特,你可以获得比较好的收益,假如你随便选了一个国内的公募基金经理,那么你就可能会亏得很惨。先锋的这个资产配置模型,只适合于美股市场。国内的市场,一方面存在着周期,另一方面投资的周期相对较短,其次是一个震荡下行的市场,或者说长期来看没有往上走的趋势,与美股市场不一样。国内市场不如美股市场有效,存在着超额收益,先锋的这套资产配置模型的先决条件,在国内其实是不成立的。
好,重点来了。那我们该怎么办呢?下面就到了量化资产配置最为基础的现代资产组合理论,马克维茨模型,也叫均值方差优化。
我们讲的MPV,Markowitz,还是MVO,其实它们都是基于同一套的理论,只不过不同的人出于不同的习惯有不同的称呼而已。我们接下来就会详细地来讲讲,马克维茨模型的的原理是什么,它是如何去进行资产配置的,又是如何去融合不同的用户风险等级的。
为什么我要仔细去讲这个模型呢?这个模型发轫于1952年,是一个很老的模型,虽然实用性值得商榷,但它却是其他所有量化资产配置模型的基础,相当于我们要学会1+1,只有当我们学会了资产配置中的1+1以后,我们后续才会讲1+2,1+3,但都是要有这个1+1的基础。所以大家一定要对这个模型比较了解。
模型目标是什么呢?是给定风险的收益最大化,或者是给定收益的风险最小化,这两者其实是同一个意思。在数学上,我们追求效用的最大化,收益减去千分之五,乘以A,一般来说A为风险延误指数,再乘以投资组合的方差,这里面有两项:第一项是投资组合的收益,为鼓励项,再减去惩罚项,就得到效用。当我们把效用最大化的时候,我们就得到给定风险等级下的最优函数。因为给定风险下的效用最大化,证明了其他任何的资产配置都无法比现在这个组合性价比最优。
我在这里列举了马克维茨模型七个很重要的假设:
第一个假设是,风险是可预测的,并且收益是正态分布的。这一个假设,也是1952年马克维茨在博士论文中提出的结论。
第二点假设是,效用是风险和激励综合作用下得到的函数。
并且是向边际递减的单调函数,也就是说收益越高,额外的每个单位收益带来的快乐或者心理满足感是越来越少的。当投资人是处于亏钱的状态,年收益率为-5%的时候,他获得了10%的收益达到了5%,这个时候他的心理满足感是非常大的;而当他的年化收益率为80%的时候,同样是给予他10%的收益达到了90%,这个时候他获取的心理满足感远远不及前者,效用函数的增加远远小于-5%到5%的满意度,这就是所谓的编辑效用递减。
第四点假设是所有的投资人都是风险厌恶型的。也就是说现在有两个选择,第一,我给你10块钱,是完全确定的;另一个选项是50%的几率会得到20块钱,和50%的几率不获得金钱。理论上来讲,两者的数学期望都是10块钱,一个风险中性的人对这两个选项是无所谓的,他可以拿这10块钱,也可以选择后者。但是,基于这个假设,投资者都会选择第一项,也就是风险更小的那项。虽然预期收益都是10,但是前者风险更小,它的收益是确定的,所以投资者都会选择前者。
还有一个理性人假设,以及没有投资费用和有效市场假设等等。
这个模型很简单,它的输入是三个元素:第一个是每一类资产的预期收益,也就是前面提到的收益项,第二个是每一项资产的标准差,也就是风险项,作为风险的衡量,第三个是各个资产之间的相关性,如果是多于两个资产,就是相关性矩阵,来衡量资产之间的关系。
它的输出是一个叫有效边际的东西……接下来,王蓁开始教大家,在真正开始搭建马克维茨这一个智能投顾中的基础核心模型的时候,如何去做数学的组合计算。王蓁还会在该节课程中详细讲解,在含有和不包含无风险资产情况下,该如何计算得到有效前沿;还有,作为核心基础的马克维茨模型参数又是如何求得的呢?参数估计方法有哪些--有使用历史样本值;有使用多因子模型;还有使用Bootstrapping和贝叶斯估计,想知道它们是如何具体运算来求得模型参数,一点一滴建立起具体可行的模型的吗?计算过程详解和耐心细致的指导都在智能投顾高级培训班初级课程第三节当中!
王蓁最后总结道,今天(周二)讲的模型公式比较基础简单,大家回去一定要注意复习。下一节课周四的BL(Black-Litterman)模型会涉及到更多的数据推导,会更复杂一些,也更有意思。
获取更多内容,请点击:智能投顾高级特训班:初级-高级 系统详解,全网独家
学员: 我的理解是 智能投顾实现的是 通过对用户资产、用户投资需求的分析形成的用户风险偏好无差异曲线和资产组合相切实现的。用户的风险偏好无差异曲线是怎么得来的?
王蓁:在不同的模型当中有不同的实现方式。下一节课要讲的BL模型有其他的实现方式,而在今天讲的马克维兹模型当中,通过引入一个用户的风险偏好的变量,这个变量是一个非负数的实数。当该变量变大的时候,风险偏好会越来越低。我们在目标函数中直接引入风险偏好参数,对目标函数进行最优化求解,从而得到给定风险等级下最优的组合配比。下节课我们在讲BL(Black-Litterman)模型的时候,我也会讲如何加入用户风险等级这个因素进去。
学员:能不能多多讲解一下如何看懂课件里的图形和数据?
王蓁:课件里的图形有一些还可以忽略,不太重要。主要是公式,一定要理解透。比如如何通过多因子模型(APT)来估计,分解成各个因子后,因子的收益是可以通过其他途径比如线性回归得到的,这样就可以通过两个向量的內积得到预期收益,有了预期收益,推导求出协方差的矩阵就可以得出最后的结果了。
学员:如果要开发智能投顾,核心是否就是提供公式给研发同事并实现?
王蓁:简单来说,是的。稍微展开一下,实际我们在项目实施的过程当中,这些模型或者公式就是我们的研究成果。当我们有了这些公式之后,我们需要做的事情就是结合具体的数据,把它写成一个实现流程的说明文档而已。
举个例子,如果我要使用历史样板的估计值,来做马克维茨模型的实现,那我会怎么去写清楚呢?我会告诉同事,取过去三个月每天的数据,来求简单算术平均得到一个值。开发的同事不需要了解这是什么,只需要知道这是一个值即可。然后,再使用过去三个月每一天的这个值求得方差,和协方差的矩阵。获得了之后,所有的参数和流程就齐全了。在这个过程中,可以做一个说明,说我们的数据是要什么格式的,可能要做什么样的整理,计算和清洗,这些都是属于数据获取部门的工作。
但在研究的过程中,我们也是需要做一些这样的工作。数据处理完了之后,去进行建模的一个过程才是我们工作的核心。刚才讲的第一步通过简单算术平均求值是第一步,求协方差矩阵是第二步,那么第三步就是设定好实际调查得出的风险变量后,将这些参数求得的值代入到建立的函数当中去。数值计算可以我们自己来求,也可以教研发同事如何去求,求出来以后将这个极值返回给我们,就完成了整体模型的全部步骤了。所以核心就是这整套公式的建立和参数该如何去估计,这是最难的一点。
学员:我们如何知道,市场上的智能投顾产品使用的是什么模型?
王蓁:没有办法从表面的观察得知,除非是对方告诉我们。比如说Wealthfront,号称使用了Black-Litterman Model,比这节课的模型要复杂,我们下节课会讲;比如说国内很多的智能投顾提供商,都会说自己采用的是基于马克维茨模型的智能投顾系统。我们今天上完课的学员,不需要听后面的课程,出去都可以带领团队,在两三周内开发基于马克维茨模型的智能投顾,效果如何暂且不管,但一定是基于马克维茨理论开发的模型。
希望大家理解,所有智能投顾的核心或者门槛,都是在于需要计算的模型本身,其他数据之类的,在目前来说远远构不成门槛。原因就在于,现在国内懂智能投顾模型的人很少很少。