1 引言
平均差和标准差是反映变量离散程度的两大重要指标,在科学研究、生产实践、经济管理和投资分析中具有非常重要而广泛的应用价值。几乎所有教科书上都表明平均差在数学上远远不如标准差优越,称标准差为“最常用、最重要、、最理想的指标”。其实,标准差存在着准确性低、误差大的致命性缺陷,且缺乏解构性功能,而平均差因运用绝对值计算的数学运算缺陷在当今发达计算机时代已不复存在,其应用范围不大的原因不在于标准差本身,而在于我们对标准差的数
学性质的挖掘和扩展研究不够,未能发现标准差所具有的数学性质的多样性和广泛性。其实,平均差通过计算公式转型,推导出新的计量模型,可以从中发现和拓展出若干数学性质,且具有解构性功能,本文就此展开探讨。
2 平均差新算法的数学推导
设总体标志值数列为X1,X2,…Xn,总体标志值的平均值为,各标志值与平均值的偏离程度为
,
,…
,平均差为AD, 则其数学表达式为(平均差的原型计算公式):
————————————————————⑴
⑴式的两边同时平方,得
——————————⑵
因为,所以⑵式可变形为
—————————⑶
⑶式的两边同时开方,得
—————————⑷
我们将⑷式称为新的平均差计量公式,它是由平均差的原型计算公式推导出来的,运用⑷式计算所得的平均差,不仅在数值上与原型方法计算出来的平均差等价,反映标志变异程度的数据与原型平均差同样准确,而且它所具有的数学性质和解构功能却大大拓展了,并且与标准差相比,它兼具反映标志变异程度的准确性和解构性优势。为了下文进一步研究和表述方便,同时避免与原型平均差AD相混淆,我们将AD以δ替代,δ2就表示均差方(或平均差方,指离差的绝对值的算术平均数的平方)。于是⑶式、⑷式依次可以变型为⑸式、⑹式:
—————————⑸
————————⑹
3 平均差的数学性质及其证明
均差方和平均差δ具有若干数学性质,下面仅就其中的12条数学性质进行阐述与证明。
性质1 若总体各标志值均为常数C,则反映标志变异程度的平均差为0。
证明:
设总体各标志值均为常数C,即。
因为,所以,有
故有。
性质2 平均差δ与平均差AD等价,反映标志变异程度的数据与平均差AD同样准确。
δ=AD ———————————————————————⑺
证明:
由于平均差δ是由平均差的原型计算公式推导出来的,因而运用⑺式计算所得的平均差δ,在数值上与原型方法计算出来的平均差AD等价。下面,举例说明平均差δ的这一数学性质。
例1,某机械制造有限责任公司共有员工30人,2009年度每一员工的工资总额如下表所示:
员工 代号 |
工资 总额 |
员工 代号 |
工资 总额 |
员工 代号 |
工资 总额 |
员工 代号 |
工资 总额 |
员工 代号 |
工资 总额 |
1 |
43665 |
7 |
43665 |
13 |
63163 |
19 |
29684 |
25 |
38788 |
2 |
35546 |
8 |
35546 |
14 |
33644 |
20 |
32868 |
26 |
34332 |
3 |
54367 |
9 |
54367 |
15 |
51298 |
21 |
27786 |
27 |
36756 |
4 |
49812 |
10 |
49812 |
16 |
29898 |
22 |
55434 |
28 |
35066 |
5 |
32245 |
11 |
32245 |
17 |
43689 |
23 |
48656 |
29 |
34465 |
6 |
22453 |
12 |
22453 |
18 |
42246 |
24 |
35486 |
30 |
37769 |
经计算得:
平均差AD=8353(万元/人);平均差δ=8353(万元/人);
显然,δ=AD。
性质3 平均差的平方等于离差平方的二次算术平均数加上协差方绝对值的二次算术平均数,即平均差的平方是由离差平方的二次算术平均数、协差方绝对值的二次算术平均数等两部分构成的,这两部分之和的平方开平方后则为平均差。因而,这一数学性质使得平均差δ具有解构性功能。
证明:
⑸式的两边同除以,可得到
——————————⑻
⑻式表明,把平均差δ看成一个整体,那么这一整体由两个部分构成,第一部分是离差因素在平均差δ中的影响程度,它反映的是各变量离中作用对整体平均值的影响程度;第二部分是协差方因素在平均差δ中的影响程度,它反映的是各离差之间差距的协同作用对整体平均值的影响程度。
为方便分析和说明,令
————————————————⑼
————————————⑽
例2,某电器制造有限责任公司2003-2010年度的资产净利润率如下表所示:
年份 |
资产净利润率 |
2003年度 |
-36.44% |
2004年度 |
-7.98% |
2005年度 |
-2.54% |
2006年度 |
-1.58% |
2007年度 |
-0.15% |
2008年度 |
2.35% |
2009年度 |
15.08% |
2010年度 |
45.66% |
根据上表所列数据,计算得:
=14.42%
=27.74%
=72.26%
设表示离差因素对平均差δ的生成量,
表示协差方因素对平均差δ的生成量,则有
=14.42%×27.74%=4.00%
=14.42%×72.26%=10.42%
上述计量分解的结果表明,该电器制造有限责任公司2003-2010年度的资产净利润率平均差为14.42%,其中离差因素作用生成平均差4.00%,占比27.74%;协差方因素作用生成平均差10.42%,占比72.26%。
平均差所具有的这一数学性质,尤其是协差方因素作用生成比重较大的平均差,揭示了时间序列上存在着强烈而重要的数据信息遗传作用,它在股市投资预测和定价分析中有着显著的解释功能与重大的应用价值。
性质4 变量对算术平均数的均差方小于对任意常数的均差方。
证明:
设X0为任一变量值(任意常数),且≠X0,则应有
,
,变量对任意常数的均差方为:
因为,亦即
,且
,
所以有,
————————————————————⑾
性质5 N个同质独立变量和的均差方等于各个变量的均差方之和。
—————————————⑿
证明:
因为合变量
所以(根据算术平均数的数学性质)
+…
。
所以有,。
性质6 若各个变量的平均差中有两个及以上的数值为非零,则N个同质独立变量的平均差小于各个变量的平均差之和。
————————————————⒀
证明:
因为各个变量的平均差全部大于等于零,且其中有两个及以上的数值为非零,所以有
,从而得出
所以有,。
性质7 N个同质独立变量平均数的均差方等于各个变量均差方的平均数的。
—————————————————————⒁
⒁式中,为变量平均数的差方,
变量差方的平均数。
证明:
变量的平均数
而的平均数
+…
故有,。
性质8 每个变量同时增加(或减少)同样数值,均差方和平均差的数值不变。或者说,每个变量发生平移,均差方和平均差的数值不变。
证明:
设原来变量数列为,其算术平均数为
,均差方为
,平均差为δ。于是,根据公式⑸、⑹,有:
再设新数列每个变量同时增加b,即新数列为,其算术平均数为
,均差方为
,平均差为
。则有,
。
同理可以证明,每个变量同时减少同样数值,均差方和平均差的数值不变。
因此,均差方和平均差体现的是数据的波动大小,而平移(同时增加或减少同样数值)并不改变这种波动性。
性质9 每个变量都扩大(或缩小)同样幅度,均差方扩大(或缩小)幅度是每个变量变幅的平方数,平均差扩大(或缩小)的幅度与每个变量变幅相同。
证明:
设新数列每个变量是原数据的k倍,即新数列为,其算术平均数为
,均差方为
,平均差为
。则有,
。
性质10 变量线性变换的均差方等于变量的均差方乘以变量系数的平方。换言之,如果自变量X与因变量Y之间的关系为线性相关,且有,a、b为常数,则:
—————————————————————⒂
证明:
自变量X的均差方为
因变量Y的差方为
根据均差方的数学性质,同时增加(或减少)一个数,均差方的数值不变,所以,自变量及其平均值同时减去a,因变量Y的均差方变形为
故有,。
性质11 均值左边变量偏离均值的均差方与均值右边变量偏离均值的均差方始终等价,两者的平均差也等价。
,
。
证明:
设总体标志值数列为,总体标志值的算术平均值为
,总体平均差为δ。其中:
为在总体算术平均值左边的变量(亦即均小于平均值),其偏离总体平均值的平均差为
;
为在总体算术平均值右边的变量(即均大于等于平均值),其偏离总体平均值的平均差为
。则有
根据算术平均数的数学性质——各变量值与算术平均数的离差之和等于零,则。于是有
即,它表明
与
之间绝对值相等,符号相反。
等式的两边同时平方,并同时除以
,得
因为,所以
上式的等式左边为左均差方,上式的等式右边为右均差方,左均差方等于右均差方。
等式两边同时开平方,得
显然,左平均差=右平均差。而平均差的数学性质——平均差δ与平均差AD等价,故有左平均差等于右平均差,。
性质12 左平均差与右平均差之和等于总体平均差,两者均差方以及协差方三项之和等于总体均差方。
————————————————————⒄
证明:
如前所述,存在以下两个恒等关系,
,且根据平均差的数学性质——平均差δ与平均差AD等价,所以,有
同时,将上式的等式两边同时平方,得
故有,,
。
下面举例说明本条数学性质。
例如,某食品加工股份有限责任公司2009年-2010年每季度年化资产净利润率如下表所示:
时期 |
资产净收益率 |
时期 |
资产净收益率 |
2009年一季度 |
-16.24% |
2010年一季度 |
-1.65% |
2009年二季度 |
-12.35% |
2010年二季度 |
13.66% |
2009年三季度 |
-10.96% |
2010年三季度 |
15.68% |
2009年四季度 |
-8.89% |
2010年四季度 |
25.32% |
=0.57%
总体均差方:;总体平均差:
左均差方:;右均差方:
总体均差方:
总体平均差:
本条数学性质具有非常大的理论与实际应用价值,这不仅将总体差方与平均差划分为左差方和右差方、左平均差和右平均差,而且很重要的一点是将左差方和右差方、左平均差和右平均差计量的自由度均定位于总体标志变量阶数N。这一数学性质,在投资风险分析、气候气温预测中具有非常重要的应用价值。
4 结语
本文以平均差的原型计量公式为基点,推导出新的计量模型;从中发现了平均差至少具有12条数学性质,并对这12条数学性质进行了阐述和证明。
平均差所存在的数学性质有许许多多,本文发现并论证了其中的12条,其余数学性质有待于深入挖掘和论证。
从数据准确性、归因解构性、信息涵盖性和应用广泛性等4个维度进行全面考察与比较,我们认为平均差优于标准差。基于篇幅所限,将另文研讨与交流。
参考文献:
⑴ 张梅琳等,新编统计学[M],上海:立信会计出版社,1994,29-43.
⑵ 赵海燕,陈立秋,张晓方,平均差和标准差在变异指标中的代表性浅议[J],统计与咨询,2002,4:27.
⑶ 龚承刚,对标志变异指标的重新认识[J],浙江统计,2000,6:8-9.
⑷ 韩兆洲,杨林涛,极差、平均差和标准差之间测度关系研究[J],统计与信息论坛,2008,4,:5-8.
⑸ 樊顺厚、刘树琪,概率统计中标准差与平均差的关系[J],天津纺织工学院学报,1994,2:117-120.