谬误:以研究的名义
——评有关学者的“收入差距研究”[1]
1、发现?
以中国社会科学院研究生院教授汪小涓第一署名、中国社会科学院研究生院博士研究生李辉第二署名的《我国地区之间实际收入差距小于名义收入差距——加入地区间价格差异后的一项研究》公布了一项惊人的发现,据该文表5列出的数据,上海市的人均实际收入比北京市低26.5%、比宁波市低29.4%(北京、宁波、上海三市人均实际收入分别为15638元,16284元、11503元)。由于该文把人均实际收入等同于实际生活水平(这基本上是可以的),所以上述数据等于宣称上海市民的实际生活水平远远低于北京市民,更远远低于宁波市民。
笔者对宁波近年来的情况了解不多,但长期生活于京沪两地,感觉上上海的生活水平即使不高于北京也与北京相当,当回答别人“北京好还是上海好”这类问题时,总是说“各有千秋”。相信大多数熟悉京沪两地社会经济环境的人士会有同样的感觉。“收入差距研究”发现了京沪两地的实际生活水平存在巨大差距,与人们的日常经验和感觉完全不符,可以说是一项重大而惊人的发现。鉴于社会科学领域很少有这样的发现(大概这也是《中国社会科学文摘》把该文放在头条的原因吧),我们似乎应该对研究者表示祝贺。但是且慢。
我们也许不得不承认,大多数如“收入差距研究”这样的社会科学实证研究只是用精确的概念和数据验证了人们的经验或感觉。比如我们根据观察,可以说:北方人比南方人更喜欢吃面食(提出假设)——通过研究(定义“北方人”、“南方人”、“面食”等概念,设计问卷,做抽样调查,分析粮食销售数据等等)发现:1、北方人均月购买面粉4千克,南方人均月购买面粉2千克;2、60%的北方人晚餐主食首选面食,35%的南方人晚餐主食首选面食——结论:北方人确实比南方人更喜欢吃面食(假设得到验证)。如此而已。所以在社会学界流传这样一句关于什么是社会学的“经典”名言:“社会学就是对明明白白的事情做煞费苦心的解释”。虽不无调侃,却也道出大多数实情,亦体现一种社会学的“诚实”。一旦我们得到一项严重背离常识、经验或感觉的“研究成果”,无论它披着什么样的学科外衣,我们的第一反应不应该是欢欣鼓舞,而是要冷静下来,要告诫自己:这可能是重大发现,也可能是重大谬误。要仔细检查研究过程的每一环节(方案设计、概念定义、指标设计、测量工具设计、样本选择、数据采集、数据统计分析、逻辑推理等等)是否可靠,所获结论是否经得起现实的检验,切忌匆忙发表,以免误导大众媒体(“收入差距研究”引用了2005年2月相关数据,《经济研究》当年9期即予以发表,双月刊《中国社会科学文摘》当年6期即予以摘要转载,业内人士不难看出该文从写作到首发到被转载的速度相当快)。至于是否会误导大众,倒不必过于担心,我们可以相信上海市民不会因为“收入差距研究”的重大发现(如果大众传媒对此进行炒作的话)而心理失衡,估计北京人和宁波人也不会因此而沾沾自喜。
虽然“收入差距研究”并不是重点研究京沪(或甬沪)两地实际生活水平的差距,但是该文的分析过程包含了上海市的人均实际收入比北京市低26.5%、比宁波市低29.4%(并等价于上海居民实际生活水平远远低于北京和宁波)的结论,而该结论又与实际情况严重不符,使我们不得不质疑其研究设计有问题。
2、谬误!
“收入差距研究”把人均收入分为人均名义收入和人均实际收入,国家统计局公布的人均可支配收入就是人均名义收入,把人均可支配收入除以城市价格指数得到人均名义收入,这完全没有问题。比如说我的收入比你高一倍,但是我这里买同样的东西比你那里也是贵一倍,那么我们的实际收入其实是一样的,我们的实际生活水平也是一样的,因为虽然我的钱比你多一倍,但是拿这些钱买回来的东西是一样多的。这道理很简单,符合人们的常识。关键是城市价格指数怎么计算。
“收入差距研究”把住房、通讯、医疗、教育、交通、食品和衣着等七类商品和服务的价格的简单(算术)平均数作为价格指数——问题就出在这里。研究者也意识到这样简单的算法会带来偏差,但是没意识到偏差程度之大已经使这项研究毫无意义——因为这项研究的方法基础和最终结论(我国地区之间实际收入差距小于名义收入差距)都没有超出常识范围,体现研究者功力之处就是拿出比较准确的定量数据,如果数据严重失真,那还不如止于常识。下面分析“收入差距研究”计算城市价格指数的谬误所在。
1、未考虑各项支出的权重,导致价格指数失真。虽然研究者自己指出了这一点,但对其严重性估计不足。由于住房的单价比其他商品的单价高出几个数量级, 它们的算术平均数主要取决于住房价格,因此“收入差距研究”中列出的城市价格指数实际上主要反映了各城市的房地产价格的相对水平。
2、把同类但不同质的东西作比较,导致价格指数失真。以住房为例:表面上上海的住房比北京贵不少,但实际上由于北京的商品房以塔楼为主,容积率(单位土地面积上的建筑面积)比较高(一般在4以上,即每一平米土地盖四平米以上的房子),上海则以板楼为主,容积率比较低(一般在2.5以下),上海用较多的土地盖较少的房子,使人们享受较多的阳光和较好的户型,使得相对于较高的土地成本而言,上海的房子并不见得比北京贵多少。也就是说,上海住房的较高价格部分源自其较高的品质。按照“收入差距研究”的逻辑,因为上海的住房品质较高,所以其价格较高,所以上海的价格指数较高,所以上海的人均实际收入较低,所以上海的实际生活水平较低。这是很不可思议的逻辑,竟然从享受较高品质的房子推导出实际生活水平较低。
3、把住房视为单纯的消费品,导致价格指数严重失真。住房有保值增值的功能,所以住房并不仅仅是消费品,同时也是投资品,而且对大多数都市居民来说是最安全的投资品。上海的住房售价比北京高,但上海的住房租赁价格并不比北京高,甚至还略为低一点。在2005年2月,上海的住房年租金大约是房价的二十分之一,北京则是十分之一多一点,这说明什么?说明上海的房子有较高的投资价值,房东虽然收到的租金较少,但房子升值较多,而且很容易变现。一般的消费品使用一段时间后多多少少总要贬值,而买进房子住几年后还能以更高的价格再卖出。从投资的角度看,上海人把现金换成房子比把现金存入银行要好,平时收的房租比银行利息高,需要时又很容易把房子再换成现金。按照“收入差距研究”的逻辑,因为上海的住房投资价值较高,所以其价格较高,所以上海的价格指数较高,所以上海的人均实际收入较低,所以上海的实际生活水平较低。竟然从拥有投资价值较高的房子而推导出实际生活水平较低——这又是多么奇怪的逻辑!
京沪两地属同一等级的城市,两地的房子作为消费品其价值是差不多的,所以两地的房屋租金水平差不多(如前所述,上海的房子品质较高,按理其租金也应该高一点,但由于其投资价值较高,导致过度投资,导致可供出租的房源较多,因供大于求而压低了租赁价格),因为租金体现的是住房的使用价值。“收入差距研究”关注的实际收入体现的是实际生活水平,因而用以调整实际收入的城市价格指数应该是城市消费品价格指数。当住房的投资价值与使用价值有较大程度背离的时候,如果用住房的售价作为样本价格,就会使消费品价格指数失真,因为住房的售价既包含其使用价值,也包含其投资价值,此时应该用住房的租赁价作为样本价格。尤其在不考虑各类支出权重的情况下,更应该把住房的租赁价作为城市消费品价格指数的样本价格。住房是一次性消费,不是每天每个月都要购买的,把住房的销售单价与其他经常性消费品的单价做简单算术平均没有任何意义。
根据上述分析,“收入差距研究”给出的城市价格指数实际上是城市房地产价格指数,用这样的指数调整各城市人均实际收入,并推论各城市的实际生活水平,就产生了上海的人均实际收入和实际生活水平远低于北京、宁波这样令人无法接受的谬误。
3、借鉴┅┅
“收入差距研究”存在谬误的原因,除了数理思维不够缜密(如对算术平均数的局限性估计不足、对一次性消费与经常性消费不加以区分等等),主要的还是不了解实际情况。如果事先知道住房还有品质问题,造房子还要考虑容积率,房地产还有投资价值的差异等等,在设计研究方案时可能就会谨慎一点,可能就不会让住房价格在价格指数中起主导作用。这提醒我们,做研究不能仅凭统计数据。凭想象随意设计研究模型,然后把现成的统计数据输入进去,电脑一算,输出结论,说不定还有重大“发现”——这样做研究轻松固然轻松,足不出户就可纵论天下大事,碰巧被大众传媒炒作一下还能名利双收,只是这样的研究成果即使不出谬误也很难超过常识水平。这也提醒我们,作研究,定量不一定就高于定性,事物的性质没弄清楚前不要追求数量。还是应该记住一句老话:理论必须联系实际。
注释:
[1] 《中国社会科学文摘》2005年6期,6-10页,原载《经济研究》2005年9期。