统计要尊重科学,不能当“估计局”
如果说统计局是“估计据”,统计局长肯定坐不住,这简直是对统计局的全盘否定,因为国家所有的数据都是一笔一笔统计出来的。
但是今天人民日报又一次批评了国家统计局,这次批评是因为:“我国城镇居民人均居住月支出111元”受到了质疑。说实话,我不知道的这一组数据究竟该怎样算出来的?我家两口人,别的不算了,就算水电燃料费每月就有200元左右,两口人,也就和国家统计局的数据接轨了。我这栋楼的五十多户就水电燃料费一项几乎都接轨了。
人民日报说:“按照国家统计局的说法,这‘111元’跟购房支出无关,也就是说不关房价的事。排除这一因素,呈现给公众的居住支出数据,也还是明显低于公众感受。”这话说得极是。
如果统计局数据“明显低于公众感受”,说他是“估计局”也就差不多了。
统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
概率论是研究随机性或不确定性等现象的数学。这是20世纪数学发展最伟大的成就。有人形容:“机率论是用来模拟实验在同一环境下会产生不同结果的情状。典型的随机实验有掷骰子、扔硬币、抽扑克牌以及轮盘游戏等。”
建立样本,由样本推算整体,这个样本要足够大才能符合大数定理,才能得到近似服从正态分布的结论。
中国13.4亿人口,东西部差异这样大究竟要多大的样本才能比较客观反映全部?样本大小决定了这个结果。
国家统计局的样本是65600户,这是城镇人口,样本不算小了,65600户的调查也不容易,但为什么差距这么大呢?
我觉得还是调查中的问题,调查中一共有7种费用支出,每种费用的极差都相当大,这种极差的叠加最终形成了与实际的距离。
记者调查中发现:“北京市朝阳区居民魏姐的住房支出情况更贴近‘111元’。魏姐是事业单位工作人员,房子属于福利分房。目前比较固定的住房支出为每年卫生费36元,每月水电费200多元、煤气费20多元。由于是单位小区,不用交物业管理费和取暖费。据此计算,她家每月的人均居住支出为八九十元。”
这种家庭是最贴近统计局的数据,这就和我前面说的差不多,魏姐锁在一个院子的居民都是大差不差,也是说明这种数据的局限性非常大。
这些年统计局的数据饱受诟病,几乎没有数据不会不受到质疑,质疑越多,越质疑,恶性循环。
因此,统计局应该反省了,如此下去怎么了得,辛辛苦苦回报的都是质疑。
如果换一个方式公布数据,把这七种数据分开公布,那么许多问题就不会叠加,也许质疑就会更少一些。
由于数理统计的理论来源于概率论,其中典型的随机实验有掷骰子、扔硬币、抽扑克牌以及轮盘游戏等。如果国家统计局公布的数据与公众的感受差异过大,那么大家必定会认为国家统计局在玩掷骰子、扔硬币、抽扑克牌以及轮盘游戏。
如果是这样,说国家统计局是“估计局”也恰如其分了。
二〇一一年五月六日星期五