陆铭谈如何做实证研究(一)
如何完成一项实证研究?
(根据陆铭演讲稿整理)
实证研究和理论研究一样, 对于我们的学生来讲, 往往比较容易关注到中段。 就像在吃一条鱼的时候, 就看到鱼肚子很肥,但你们不知道在做这项研究之前和 之后有很多的工作要做,而这个之前和之后的工作往往占到 70%的时间,但你们 就看到这个中段, 就是 paper 本身。 那么对于实证研究来讲, 之前需要做什么呢? 首
先,在你做实证研究之前,你要有一个 great issue(大问题)作为你的 研究背景。这就是“大处着眼”的问题,但是你必须要有一个 small point,也 就是我经常讲的“小处着手”的问题。有了一个 great issue 就使得你的研究重 要,而有了 small point 又使得你的研究具有可操作性。之后你要有一个好问题 (good question) 。比如我刚讲的,制度对于经济增长到底重不重要?理论制度 经济学家就会告诉你很重要,可是对于实证研究来讲,我们是不知道的。因为当 你看到制度好的国家经济发展水平也高的时候, 我们其实不知道这是不是因为它 经济发展水平高了所以它有好的制度。那么对于实证经济学家来讲就要去看 from institution to growth 的这个因果关系(causality)到底有没有,这就 是一个 great issue。 那么, small point 是什么呢?在 Acemoglu 做的研究里面, 他就想, 怎么去把这个 causality 确定下来呢?他找到了一个很重要的工具变量, 他去看非洲、 拉丁美洲等殖民地时期的自然条件,其中一个非常重要的条件就是 死亡率。他的想法是,如果在那个时期这些殖民地的死亡率高的话,白人就不愿 意住下来,这样他们就会采取掠夺式的制度。如果愿意住下来,他们就会移植欧 洲的好制度。 那个时候制度的情况就会影响到今天一些地方制度好坏的差异,于 是, 这就很可能带来增长的差异。通过这样一个链条的作用就可以确认制定是导 致增长的原因。这个做法就是一个 small point 使得他的研究变成了一个可操作 的研究。 再接下来我举的一个例子是 tea 和 sex。大家知道在发展中国家,我们出现 的一个非常重要的问题就是 sex imbalance,女孩子太少,男孩子太多。经济学 家的一个解释是, 对于一个家庭来讲, 生男孩比生女孩好。 因为男孩的生产率高, 工资高,于是投资一个男孩的回报就更高。这个解释很多人不太喜欢,说经济学 家从经济学角度来解释生育行为不对,他们觉得这就是文化的影响,大家都不喜 欢女孩子, 歧视女孩子。 那么经济学家讲的到底对不对呢?于是就有我刚讲到的 tea 和 sex 研究里面, 有一个美籍华人叫 Nancy Qian, 她是前年的美国 job market 上的 star,现在到 Brown 去了,她来过复旦两三次。在她的研究里面就用中国 的数据来检验家庭生育行为是一种经济决策。她想到,在改革开放以前,各种商
品的价格都是被管制的, 改革开放以后价格在逐渐放开,于是经济作物特别是茶 叶的价格上涨了。 大家知道摘茶叶这件事是女孩子的比较优势,因为女孩子比较 细心。那么,根据经济理论的推断,茶叶的价格上升就会导致女孩的回报提高, 这样就会使得家庭更加愿意生女孩, 就会在孩子出生以后给女孩更多的照顾以减 少她的死亡率。于是她就用了这样一个自然实验(natural experiment) ,价格 改革这个自然实验提高了女孩的回报,于是提高了女孩的出生率和存活率,结果 她的研究发现就是这样的。 那大家可能马上就想了,这些都太复杂了,我做不了。做不了可以做些简单 的,比如我要讲一个矿难的例子,当然这个也不简单,因为你要是研究矿难会很 麻烦。但我想举个例子,前年的经济学年会上,有一位老师说,他观察到中央政 府要求地方政府提高矿难职工死亡的补偿费以后,矿难反而增加了。为什么呢? 根据经济理论, 这有可能引起更严重的道德风险。如果安全措施是由经济决策决 定的,而生命是有价值的话,矿难水平提高了意味着如果减少安全措施,一旦发 生事故,补偿金水平提高了,这就会增加人的道德风险,降低安全的保障措施, 这就有可能导致死亡率上升。问题在于,你们如果学过信息经济学,要做出一个 像我刚才讲的这个故事的理论是非常容易的。可是这里面就遇到一个问题了,他 刚才讲的这个故事到底是不是真的?是不是在补偿提高以后矿难的发生率反而 提高了?或者说这两件事情有没有因果关系?我们不知道的。 如果你要是把这个 文章做出来,一定是非常好的文章,因为它是一个大问题,它可以证明,人的生 命是不是可以用价格来算的。 在你提 出一 个好 的问 题以后 ,一 定要 充分 去做 文 献评 论( literature survey) ,这可以达到几个功能:第一,通过文献评论你可以去证实你的研究为 什么重要。比如我刚讲的矿难问题,如果你的文献评论是这样做的:某年某月有 个人说,这两者是正相关的,所以我这篇文章就要去证明这个,那这篇文章就没 人感兴趣了。如果你的文献评论是这样的:在经济理论里面有人提出,人对于安 全设施的投入是一个经济的计算,对此很多社会科学家是有争论的。比如一些社 会学家认为经济学家的这些观点是错的, 这篇文章通过矿难的案例来告诉你经济 理论是否正确。人家就会觉得非常重要。第二个你要做的工作就是,要说明 what’s new? 我们做研究最容易忽略的就是 what’s new。你做一个东西出来, 你的读者为什么要看?你一定要在做的过程中想办法在你的东西里挖出一些新 的东西来吸引你的读者, 因为看文章对于每个人来讲都是有成本的。我们很多同 学以为,我做了一个伟大的工作,但我不说,我很酷。我告诉你,如果现在做研 究就抱着这样的心态,你死定了。你做一项研究,你一定要竭尽全力地要把你的 工作在 idea,method,data 这几个方面跟既有的研究去做比较,来告诉大家, 我用了一个不同的 idea,我用了一个不同的方法,我的方法能够得到更加准确
或者 unbiased 的估计。我的 data 是新的,别人的样本很小,我的样本大,别人 没有这个度量,我有这个度量,所以我新。 再来谈研究之中,这个时候你首先需要一个理论。我刚才已经讲过了,这个 理论和分析框架涉及到的第一个问题就是我需不需要数学?这我刚才已经回答 过,就不再重复了。 第二个就是数据(data) 。你的 data 哪来呢?当然我们有很多现成的数据, 比如象我们做实证研究的,手头都有一些数据,但是你们以后去做实证研究,不 管是去公司里做还是在学术界做实证研究,往往你需要自己去收集数据,这个时 候你的数据是第一手的,尤其是在初始起步阶段的时候,你的样本不可能太大, 样本大就需要钱,你没那么多钱,这样你的样本量不太大。那你要做这个研究, 怎么才能让自己的研究成为一个好的研究呢?你就要去考虑。首先,你要新,你 要注意, 是不是在你样本不大的数据里面有一些变量是别的大样本的数据没有的。 或者你研究这个问题别人从来没研究过, 你是第一次通过收集数据的方式来研究。 第二,一定要是 well defined,就是你这个数据一定要非常清楚地定义。比如, 根据已有的文献,social capital 是定义为这样几个方面,它们都是这样去度 量的,用什么样的问题来问的,所以我在我的问题里面也这样问,这样你就可以 得到好的度量(good measure) 。最后,你的数据要 well structured,就是该 有的变量你要有,你想 identify 的那些机制的中间变量你也都有,那么即便你 的样本小一点,也可以做很好的研究。 第三,你要有非常聪明的 idea,当然这很难了,所以要求就越来越高了。 在计量里面,通常来讲你看到的变量和变量之间的关系只能说它是一个相关性 (correlation) ,但现在的实证研究已经越来越不满足于相关性,而是要去看 causality。看因果关系一个常用到的方法就找工具变量。那么,这时候你用什 么样的方法去看 causality?用 natural experiment?用足够让大家确信的外生 变量?还是去找工具变量?这就需要你有非常聪明的想法来让大家确信你看到 的确实是一个 causality,而不是一个因果不明的相互关系。当然这个要求比较 高了,在很多研究领域里面都是前沿课题。对于我们来讲,有的时候不要随便说 你找到 causality 了,就是发现相关就很不容易了。 最后是计量分析(econometric analysis) ,就是要去分析、回归、解释结 果等等。我们得到结果以后就可能碰到这样的问题,首先我们会发现,这个结果 好像不对, 我们感觉到的现实好像不是这样的,具体表现为符号或者显著性不是 事先预期那样的。这个时候就要注意,有可能问题出现在如下几个方面,你一定 要去想是哪些方面出了问题, 然后再去调整它, 而不要去做 data mining 的工作。 第一个, 数据可能是不好的。 数据不好的第一个原因可能是因为用了中国的数据。 中国的很多宏观统计指标是很粗糙的, 比如中国的失业率本身就不是真实的失业
率,你用了就有问题了。还有可能你的样本不是一个随机的样本,还有就是你的 样本量太小了, 这些问题都有可能导致你的数据质量不高,从而你想看到的东西 看不到。第二个可能性就是理论出了问题。这又有两种可能性,一种是之前基于 的理论是错的,或者它根本不反映现实情况。还有一种可能性是,可能存在一个 新的理论或机制,它抵消了你原来认为的那个机制。 比如在我们自己做的一个研究里面就碰到过这样的情况, 我们在做经济开放 和国内市场分割这个相关性的研究的时候,本来觉得开放了使得竞争加剧,竞争 加剧应该使得国内市场整合, 结果后来发现往里面一放是线性关系, 而且是正的, 就是开放是促进市场分割的, 那我们就想为什么?有可能是在经济发展的早期阶 段,开放是促进市场分割的,在经济发展到一定阶段,开放就促进市场整合了, 于是有可能存在二次的关系,我们把二次项往里面一放,果真一个非常漂亮的 U 型曲线就出来了。 当你在正确的理论指导的情况下去做计量的时候,你就会知道 怎么去加东西,是改变模型的形式还是改变数据,还是改变你的 measurement? 之后你在理论的指导下得到的结果就可以帮助你发现新的东西, 因为在我刚才讲 的这个 U 型曲线的下, 就告诉我们,在理论上经济的开放和市场分割的程度取决 于开放的程度, 这个是在既有的理论里没有的东西。事实上你们在座各位如果有 人对此感兴趣, 你就完全可以去做这样一个理论来描述经济开放和市场分割之间 的关系是一个象我们所看到的 U 型, 这时候你就知道理论和实证是一个什么关系 了。 理论是怎么来的?不是凭脑袋想起来的,是把现在已经发现的事实和规律形 式化(formalize) 。 研究之后我们得到很多结果,这时候你还有一些工作要做。第一个就是你要 去解释它,我们很多同学做完了计量以后说,我的结论是 x 和 y 正相关,x 和 z 负相关。这毫无意义,就象你做了一个数学模型,做出来以后,它的经济学含义 是什么?你要去解释为什么是正的?为什么是负的?为什么有非线性的关系? 另外大家要区分两个 significance。 一个是 econometric significance,它指 的 是 在 统 计 上 x 和 y 之 间 的 关 系 是 不 是 显 著 的 。 还 有 一 个 是 economic significance,它指的是系数到底有多大,就是经济上的显著性,它能告诉你一 个 因 素 的 重 要 程 度 到 底 有 多 高 。 然 后 你 还 要 在 这 个 基 础 上 得 到 policy implication,即政策含义。 如果你象刚才讲的那样去做了,我就要祝贺你了,因为你已经在一个正确的 道路上向一个好的经济学家前进了。