CPI 的讨论应该指向编制方法:对争论批评的回应


  

导言 CPI指数本身是否存在低估的可能,最后这方面的讨论可能还是没有答案的,因为我们面对的是一个黑箱。因此,这场讨论的最重要意义并不在于谁对谁错,而在于推动统计制度的规范化、透明化,从而增强统计数据的“真实可信”性。

 

 

正文

关于本人的研究报告《统计数据和主观感受:风动还是幡动》一文,引起了各方的热议。

全文可见:http://web.cenet.org.cn/upfile/118690.pdf

《财新》和《新世纪周刊》刊载了钱军辉博士《“统计局系统性低估CPI”系误读》一文,全文可见http://economy.caing.com/2010-11-12/100198345.html

阅完钱博士的评论后,笔者特做回复如下:

 

一、对钱博士观点的回复:

钱博士的观点是:(1)“常数项c的经济学意义是当X=0时,Y的均值(或期望),这个意义经济学家常常不感兴趣。……常数项不是误差,残差才是”(2)“使用相同的数据,但是取基准为零,再次估计该模型。基准为零的意思是,原始数据为100,现为0,原始数据为103,现为3”。但估计结果发现:“常数项发生了显著的变化。代表可能低估程度的常数项由-7.53变为-0.11”,并由此认为原来的估计是错误的。

回复:(1)在这里,作者把计量模型上的“能否解释”,和这里CPI指数编制方法的“能否解释”相混淆了,说明钱博士并不完全了解CPI指数的编制原则。按照《流通和消费价格统计调查方案》给出价格指数的计算方法:CPI指数完全按照分项指数及权重来加权计算,也就是说,CPI指数的计算公式中,本是不应含有常数项的。但我们在事前并不能先验的接受“不含有常数项”这件事情,而只能将其作为零假设(H0)进行检验。否则,如果忽视了常数项,则可能造成回归模型的设定偏误,如下图所示:红色线是带有常数项的拟合,而蓝色线因为不含有常数项,拟合结果对应的残差存在较大的问题(以本回归为例,去掉常数项后,DW值由1.58下降到1.35)。因此,从经济含义、模型设定角度来看,常数项的设定在这里都是重要的。

 

(2)对常数项的解读问题。钱博士举了个反例,“使用相同的数据,但是取基准为零,再次估计该模型。基准为零的意思是,原始数据为100,现为0,原始数据为103,现为3”。但估计结果发现:“常数项发生了显著的变化。代表可能低估程度的常数项由-7.53变为-0.11”,并由此认为原来的估计是错误的。我们看下式,其中(1)式是CPI计算的定义式,(2)式是钱博士的处理方式,将各项指数减去100.

此时我们看到。权重系数之和是否等于1,成为关键。而与常数项是否为0一样,这也只能作为零假设,当作需要检验的对象,而并不能成为我们先验接受的对象。(在此有两个说明,第一,如果我们事前就接受常数项为0,权重系数和为1,把这个当作分析前提,并作为约束条件,则等于接受了这个事实,而只有将其作为零假设,才能对其进行检验;第二,即使将权重系数和为1作为约束条件,则总体分析结果与无约束的相比,也是明显的不够理想)。

总之:常数项为0(A),各项权重系数之和严格为1(B),都是需要进行检验的零假设,而不是事先给定的条件。如果我们不能拒绝零假设,则无法对CPI编制的行为进行质疑;反之,则会让我们产生疑问。

问题就出在这里,只有当8项权重系数之和为1的时候,钱博士的回归和我的回归才是等价的。如果8项权重系数之和不为1则不等价,-0.11的结果是没有意义的。而检验结果可以发现,A、B两件事情都被否定了:常数项显著异于零,各项权重系数之和也被拒绝等于1(WALD检验得F值为4.3575,对应P值为0.0427)。

再具体看一下权重系数,两种方法估计结果列表均显示总和为1.074232,并不等于1。而作者第二次估计出来的常数项0.11,则恰是7.53395和7.4232的之差。可见,权重系数之和在实际上大于1,在其中扮演了决定性的角色,而我们同时对CPI指数以及分类指数减去100的做法,将使得估计式两边出现不平衡,并通过权重系数之和大于1的暗含条件,将权重多出1的部分(7.4232)转嫁到常数项上来,得到了-0.11(7.53395减去7.4232)的结果。由此出现了作者两种估计方法的差异。就目前的检验结果来看,两个零假设(常数项为0(A),各项权重系数之和严格为1(B))均被拒绝,因此我们才能基于此提出质疑。

 

 二、对《财经》记者朱长征的回复

《财经》记者朱长征的报道认为:“徐奇渊博士的报告存有疏漏,仅仅根据较短时间的数据推算……缺乏充分的依据”。

回复:我使用的数据是2006年1月到2010年5月的月度数据,共53个月度数据。使用这一数据进行推算的依据有两点:(1)根据庞晓林《CPI不是模型推算出来的》一文,“我国价格指数编制也正如报告中所说每五年调整一次商品篮子……”;我国CPI指数的权重分类以五年为一个重要周期。最近的一个权重周期,正是从2006年1月开始的,因此选择这53个月。我在原文中已经对这个原因做出了说明。(2)况且,使用53个样本点,对9个参数进行估计(8个权重系数,1个常数项)进行估计,自由度还是相当宽裕的。因此,使用这短时间来进行推算,既是必要的,也是可行的。

 

三、补充说明:

1. 两个零假设均被拒绝,从而CPI的编制过程解释力出现问题,也可能与我们对统计制度的不了解有关(至少是翻阅我国CPI编制的公开资料所无法理解的)。关于“人为调整”的判断,确实有可能是草率了。但这些疑问能否获得解释,最终取决于我国统计制度的进一步规范和透明,我已撰写了《CPI指数编制:还需要做哪些改进?》。

该文可参见:http://oxuqiyuan.blog.sohu.com/162540226.html

 

2. 我也承认原文使用的分析方法是相当粗糙的,也不排除存在疏漏甚至错误之处,因此还有待改进和完善。但CPI指数本身是否存在低估的可能,最后这方面的讨论可能还是没有答案的,因为我们面对的是一个黑箱。因此,这场讨论的最重要意义并不在于谁对谁错,而在于推动统计制度的规范化、透明化,从而增强统计数据的“真实可信”性。