有学生跟我说:“习老师,财大这次又没上双一流!错过了211,错过了985,现在又错过了双一流,以后更困难了”。我说:“呵呵,做好自己的事就行了,不要管别人怎么看”。
我问学生说:“你们觉得浙江大学好吗?”
学生说:“当然好了”。
我说:“那好,我们来讨论一下浙江大学好在哪里?”
首先,我要讲一个假设。如果有人发明了一种新的抗癌药,为了证明这种抗癌药的效果,发明人请来了100位癌症患者,让他(她)们按要求服用此药。几个疗程之后,发现这100位癌症患者中,有50%的患者都康复了。那么,是不是说明这种抗癌药的治疗效果有50%呢?
答案是不确定的,有可能是,也有可能不是。
因为这次实验只有干预组,没有控制组作为参照,所以说明不了任何问题。也有可能,如果这100位患者不服用此药,可能康复率会有60%,那么这种抗癌药的治疗效果就是负的了,谁知道呢?问题的关键,应该是要找100位与干预组特征相似的患者做为参照,并且参照组的群体不服药,最后比较两组的康复率差(DID),才能知道抗癌药的效果。
现在,我们再来讨论江西财大和浙江大学的教育差别。
假如,我们统计江西财经大学和浙江大学2017界大学生的毕业工资,并且发现浙江大学2017界毕业生的平均工资,要显著高于江西财经大学毕业生工资约2000元。并且不管你用什么计量方法,控制什么个体特征,结果都很显著。
计量结果既有干预组,又有控制组,潜在结果可观测,是否能够说明浙江大学的教育水平显著高于江西财经大学呢?
答案仍然是:不一定。
为什么?
我们都知道浙江大学的高考分数线要显著高于江西财经大学。以2017界学生为例,假设2013年高考,浙江大学的分数线是600分,而江西财经大学的分数线是550分(假定全国的分数线都是统一的)。
很明显,浙江大学的分数线要显著高于江西财经大学。虽然上面的实验既有干预组又有控制组,但是干预组和控制组的特征差异显著,所以结果(DID)并不可靠,不能说明任何问题。
正确的做法是,从浙江大学2017界毕业生中,选取几百个样本,这些样本满足的特征是2013年入学时的高考成绩在600分附近(比如大于600分,但小于606分)。然后,再从江西财大2017界毕业生中,也选取几百个样本,这些样本满足的特征是2013年入学时的高考成绩略低于600分(为了凑足样本,可以放低到580-600分)。
这样,我们就可以比较600分附近的两批学生,他(她)们特征更加相似,努力程度和能力也应该差不多。但是,一批上了浙江大学(多数最后可能沦为浙大毕业生中相对较差的),一批上了江西财经大学(多数将成为江西财大最优秀的一批毕业生)。结果肯定在意料之外,实证结果可能表明,江西财经大学毕业生的平均工资显著高于浙江大学!
听起来好像是“田忌赛马”的盗版!哈哈,其实是实证研究最流行的断点回归,不过和“田忌赛马”有异曲同工之妙。
这是不是说明,江西财经大学的教育水平要显著优于浙江大学呢?答案是否定的(如果你有这种想法,你脑子一定是浆糊了)。
那么,问题到底出在哪里呢?首先,这只是断点回归,它只能反应高考成绩600分附近的学生,不能推广到全样本或总体的平均因果效应。而真实的平均因果效应没人检验过,无从知晓。
其次,为什么断点附近财大的学生会显著由于浙江大学的学生。我推测一个可能的原因是,那些略低于600分的学生进入到江西财大之后,他(她)们多数人都将成为最优秀的学生,可以选择自己最喜欢的专业,并且每年都有各种奖助学金,得到老师和同学的各种鼓励和羡慕,能够更加激励自己努力(棘轮效应),从而更加鞭策自己发愤图强;而那些分数略高于600分的学生进入浙江大学之后,因为在浙大相对分数低的原因,他(她)们多数人只能进最差的或者调剂到自己不喜欢的专业,或者进入好的专业也是在班级垫底,没有奖助学金没有鼓励,情绪低落且没有斗志,最终可能影响就业质量。
听起来又像是“宁做鸡头,不做凤尾”的翻版,没错!
同样一批人,进入不同的学校,却有不同的命运,而且命运还发生了反转。
为什么?
“鹿死谁手,犹未可知”,读什么大学不重要,归根结底还是自己的努力最重要。以上实验至少可以说明一点:相对于自己的努力而言,大学教育水平是其次的。因而,无论在什么样的逆境中,我们都不应该自暴自弃,马云就是最好的例证。