A股全市场选股策略研究内容摘要:

A股全市场选股策略研究 请 数量化选股策略 2010 年 6 月 22 日A 股全市场选股策略 基于行业的异质性,市场上已有的数量化选股模型多采用行业研究的模式。 但在实际选股中,投资者很难做到深耕于某一行业,时常会忽略不同行业之间的差异,在较大范围内选股,因此我们有必要对 A 股全市场的选股策略进行研究。 同时,在对全市场选股策略的研究中,我们也能获得一些较有意义的指标,揭示出市场上不容易观察到的规律,从而可以帮助投资者更好地进行选股。 z 全市场选股模型的概述。 我们选定一些与股票收益最相关的因子构成备选因子库,通过相关性分析确定其中相关性最显著的一些指标作为选股因子,对全市场的股票进行打分。 选择综合得分最高的一篮子股票作为我们的投资组合。 z 通过滚动时间窗口确定选股因子能及时把握市场规律和信息。 由于不同阶段相关性显著的因子不尽相同,所以我们采用滚动时间窗口回归统计不同因子与股票收益的相关性,选择最新的滚动结果中相关性最显著的一批因子作为选股标准,这种方法就更便于把握住不同阶段更有效的因子进行选股。 z 两种时间窗口的确定方法有待更多样本外数据的考证。 实证中我们采用了两种时间窗口的确定方法进行样本内数据的相关性分析,一种是固定时间起始点,不断扩展样本内数据;一种是固定时间窗口长度,不断包含新样本内数据,舍弃最远时间段上的数据。 在 07 年 1 月到 10 年 4 月的样本外数据上,两个策略都获取了较高的超额收益。 不过,我们需要更多的样本外数据来考证究竟哪一种时间窗口的确定方法更有效。 z 策略超额收益显著。 无论采用哪一种分析方法,选股策略都取得了显著的超额收益,尤其是固定时间起始点的样本内数据分析方法。 从月度频率来看,选股策略在大部分时间里都战胜了指数,但是其中在 08 年下跌中期和 2010 年下跌初期,策略表现较差。 而风险调整收益即夏普值也是两种选股策略最高。 z 不同市场环境下,选股指标的差异性较大。 我们发现,在牛市中,增长性的指标更具有选股的有效性,而熊市中需要从多种指标考虑公司的财务状况,很难从少数几个指标构成有效的选股策略。 实证还发现 较于 个更好的选择,在更多的样本期内,它都被列为选股因子之一。 两个盈利性指标要么就是无效,要么就与收益反而呈现负相关的关系, 两个指标呈现牛正熊负的现象。 从 09 年 10 月份以来,选股因子都集中在估值和 标上,几乎没有基本面因子入选,这表明近期基本面因子对全市场选股的贡献不突出。 z 最新一期,策略 1 选中的指标为 略 2 选中的指标为 利率 )、 5 月份选股结果见正文。 金融工程分析师 周健 业证书编号: 话: 021系人 郑雅斌 电 话: 021量 化化 研研 究究 研究报告量化选股 请 目 录 .子打分和筛选规则 .选因子库 .据处理 .略长期收益表现 .同市场环境下的策略表现 . 量化研究 2 市场上已经有很多行业选股和组合优化的模型,研究方法无外乎从宏观经济指标、公司基本面、市场情绪等角度对股票进行分类评价,然后赋予某种权重,构建出行业最优组合,这种选股方法与行业研究的模式颇为相似。 这样做可能是基于一个前提,就是行业间具有较大的差异,所以研究者多认为利用同一思路或是指标在不同行业中选股是难以获得普遍成功的。 然而,在实际选股中,投资者很难做到深耕于某一行业,时常会忽略不同行业之间的差异,在较大范围内选股,如果有这样的需要,我们就有必要对 A 股全市场的选股策略进行研究。 同时,在对全市场选股的研究中,我们也能获得一些较有意义的指标,揭示出市场上不容易观察到的规律,从而可以帮助投资者更好地选股。 本文的基本思路是构造和股价变动最为相关的因子库,通过历史回溯,观察这些因子和股票收益的相关性。 再对因子进行进一步的筛选,把与股票收益相关性最显著的因子挑出来作为选股的依据。 对这些因子打分加权之后得到股票的总得分,便可以进行全市场选股,构造投资组合,最后我们考察了策略组合长期的累计收益、超额收益以及稳定性。 子打分和筛选规则 在构建投资组合的 t 时刻,对全市场上股票在 t 时刻可得的所有因子进行分别打分。 我们这里采用排序的方法进行打分。 对每一个因子,把所有股票的因子值进行排序,每只股票相对该因子的得分即为这个因子在全市场股票上的排序位置。 如净资产收益率作为一个备选因子,某只股票的净资产收益率排序第 20 位,那么该股票在净资产收益率这一个评判标准上的得分就为 20 分。 如果针对某个因子,某些股票无法得到数据。 对其的处理原则是计算可得数据的股票在这个因子上的平均得分,数据不可得的股票采用这个平均得分。 接下来,我们考虑每个因子与股票收益率的相关性。 针对每一个因子,分析 t 时刻因子得分与 (t+1)时刻股票收益率的相关性。 将不同时间点上,所有股票的面板数据统一对待,作为样本内数据进行分析。 样本数据时间窗口的选择涉及到一个博弈的问题。 将时间窗口放大,包含更多的样本内数据,数据的稳定性会有一定的保障;但过大的时间窗口,对近期的相关性特征权重有所降低,会忽略最近的市场特性。 由于数据的可得性问题,能够获取的样本外验证时间太短,很难判定哪一种样本内时间窗口的划分方法更为有效。 在之后的实证研究中,我们对两种方法都进行了研究与考察。 我们根据样本内的股票因子得分情况与收益的相关性分析结果来确定,选股指标采用滚动的方法,不规定选股指标的个数,只要相关性分析结果显著,即把该因子作为选股标准之一,设置显著性水平为 由于相关性的统计是采用滚动时间窗口的方式,故而选股指标的确定也是滚动得到,不同时期的选股指标以及指标个数都不尽相同。 采用这种方法更具有灵活性,在不同时期都能够挑选出在当前市场形态下与股票收益最为相关的因子作为选股依据。 在每一个构建组合的时刻上,确定了所有相关性显著的指标后,对这些指标得分按照等权重加权计算股票的综合得分。 权重前面的符号,由指标得分与收益率相关性的方向决定。 正相关,采用正的权重;负相关,采用负权重。 所以,权重的绝对值之和为 1,但权重之和不一定为 1。 我们选择综合得分最高的一篮子股票作为投资标的,最终组合的权重按照股票的流通市值进行加权。 1(/) 量化研究 3 选因子库 我们最初选择的因子库包含基本面财务数据,分析师一致预期数据,技术指标以及估值指标。 在此,我们不将一致预期数据放入备选因子库,因为一致预期数据的时间窗口较短,而且一致预期数据覆盖面并非全市场,对进行全市场选股的研究有一定的限制。 下表中列出了我们最终构建的因子库。 财务类指标主要包括盈利指标以及增长性指标两大类。 经过之前关于选股的研究,以及与行业分析师沟通,发现这两类指标是能够适用于各行业的并且与股价最相关的指标。 估值类指标包括 是标准化后的估值水平,即股票相对于所属行业的估值水平。 我们采用海通二级行业的分类标准,计算行业指数的 平,将个股的 到个股在行业内的估值水平的倍数。 这种比较方法比直接比较股票的估值数据更为有效。 股票估值数据的直接比较会忽略高估值行业中一些被低估股票的投资价值,同时也没有考虑一些低估行业中的高估值股票的风险水平。 由于市场情绪也是决定股票涨跌趋势的重要因素, 所以我们采用月度 为市场情绪研判的一个标准,放在备选因子库中。 表 1 指标的选择 编码 财务指标 编码 财务指标 1 2 3 毛利率 9 利率) 4 营业收入增长率 10 资产负债率 11 资产周转率 12 料来源:海通证券研究所 据处理 我们采用 2005 年 1 月至 2010 年 4 月的数据进行研究, 2007 年 1 月开始的数据作为样本外数据。 采样频率为 1 个月,即每个月更新一次组合数据。 由于财务指标最多只有季报数据,在财务指标没有更新的月份里,采用能获得的股票的最新财务数据作为备选指标。 我们采用两种时间窗口: ( 1)固定时间起始点,不断增加样本内数据长度。 样本内数据的起始点为 2005 年 1 月,第一期样本外数据为 2007 年 1 月,即最初的样本内数据长度为24 个月度数据。 之后每更新一期,即把之前一个月的数据加入到样本内数据中。 ( 2)固定样本内数据长度。 固定样本内的数据长度为 24 个月度数据。 每当需要更新组合的时候,移动时间窗口,向后滚动一个月作为新的样本内数据。 略长期收益表现 策略最终确定的投资组合股票样本个数为。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。