这要从@比利海灵顿讲的一个段子[1]说起。据说二战期间,为了防止德国间谍伪装成美军混入阵地后方,美军曾以此问题盘问过往军人:“伊利诺伊州的首府是哪里?”正确答案是:斯普林菲尔德(春田市)。间谍经过系统培训,自然知道正确答案。但回答斯普林菲尔德的人都要受到严密审问。因为真正的美国当地大头兵受教育程度有限,他们的答案通常是芝加哥。如果对这个段子仅仅是一笑而过,那就亏大了。因为,你可能因此错失了一篇AER;)
看上面这张伊利诺伊州的地图,有两个信息非常明显。首先,最大城市芝加哥不在首府;其次,作为首府的斯普林菲尔德,位置几乎在整个州的正中心。这一点是巧合吗?不是的。Campante和Do 2014年的研究引用了很多政治学的文献,告诉我们:美国建国之初,交通和通讯条件不便。为了平等保障各地的代表权,不要给代表施加太高的参政议政成本,各州都偏向把首府放在整个州的中心[2]。因此,伊利诺伊州的情况不是特例:首府放在中间,也不是州里最大的城市。
利用这一点,前面提到的二位作者漂亮地回答了一个历史相当悠久的问题:要尽可能预防腐败,政治中心和经济中心(通常也是人口最多的地方)的距离应该要多远?有的学者说,两者应该隔得近一点。这样,企业和人民可以更好地参与政治、监督政府;也有学者说应该远一点。这样,政府更超然,盘踞在经济中心的各利益集团更难俘获政府。利用开头段子里提到的“斯普林菲尔德-芝加哥判别法”,二位学者构造了两个很棒的工具变量,证实前一种观点才是正确的。
具体来说,文章要研究的,是州内居民到首府的平均距离(用人口普查数据计算),和各州的腐败率、腐败感知度、政治参与率、公共品供给间的关系。文章采用的工具变量,是“两个中心的距离”:其中一个是人口中心,也就是州的范围内,距离全体居民的平均距离最小的点[3];另一个是地理上的中心。这个距离和居民到首府的距离高度相关,又不太可能通过以外的途径影响最终的腐败。因此,这是个很棒的工具变量。当然,个人认为:如果算灯光而非人口的中心,就更好了。
简单叙述他们的结论:工具变量法发现,州内居民到首府的平均距离增加,会导致各州的腐败案件数量显著增加、腐败感知度提高、搜索“腐败+州名”的频率上升、公共品开支下降。导致这一结果的渠道,很可能是缺乏监督。作者同时发现:州内居民到首府的平均距离增加,会导致当地媒体报道中政治新闻米乐M6 M6米乐的比重下降、选举投票率下降、两竞选开支下降。用一句话概括结果,就是“县官也得现管”。开头提到的伊利诺伊,确实也是美国贪污案件比较多的州,印证了这一结论。
[3] 为了防止人口数据可能造成的干扰,文章还用农作物适种指数计算了一个中心,替代人口中心。
作者研究的题目本身就很有趣,是看美国的博士后劳动力市场的。他想实证的主题是:为什么那么多在美国拿到博士的非美国居民愿意干工资很低的博士后的工作呢?一般有两个可能性, 一个是这些博士们本身非常热爱科研而不计较工资报酬,另外一个就是博士后工作可以得到在美国合法居住的身份。可能大部分人都会直觉上觉得是后者,但是要从实证的角度来证明得到美国合法居留身份就是很多人愿意从事博士后工作的原因其实是很难的。(关于计量里面causal-inference的问题太多了需要另开一贴讨论,在这里就不展开了)。那么有没有一种可能,就是假设美国政府给所有外国籍博士一毕业就给绿卡,保证他们都可以合法留在美国, 然后这样就可以清楚的看到还有多少博米乐M6 M6米乐士处于科研上的热情愿意去干博士后了嘛!
现在视线年代末曾经发生过一个著名的事件(你懂的)。在该事件发生以后,美国在1992年颁布了一项法案,该法案规定,对于所有在1990 年4月11日之前抵达美国的中华人民共和国的居民全部授予永久居留权(绿卡) (具体法案详情请自行搜索Chinese Student Protection Act of 1992 )。当然当时所有博士毕业的中国学生也包括在内。
他具体操作使用2SLS,然后得出的结论大家大概也能猜得到,当然是证实了大多数人的猜想。这里就不赘述了。
这篇文章的结论是:当时,中国人在美国读博士的有57%选择继续申请博士后。但是如果博士毕业就能拿绿卡,那么申请的概率就下降到43%。 换句话说,在美国申请博后的中国人中,有四分之一是为了绿卡而去的。要是博士毕业就有绿卡的话,他们博士毕业就离开学术界了。
评论区有几个同学问道这篇文章的工具变量到底是什么。我把文章的abstract 贴上来吧。知乎的作用是普及,又不是深入学习经济学的地方。对这篇文章感兴趣的自己去看原文啊。
这大概是我最初读得很过瘾并且有“哇塞 原来学经济学的脑洞还可以这样开” 的感觉的论文之一吧。虽然后来转行了,但是想起来当初的感觉还在。
第一个是1991年QJE上 Angrist&Krueger 的Does Compulsory School Attendance Affect Schooling and Earnings?。这篇论文研究的是一个老问题:教育对收入的影响。我们知道,由于有遗漏变量的问题,直接做OLS回归会有内生性问题。这篇论文考虑到,由于美国的义务教育规定是按年龄限制的,不到一定的年龄就不能离开学校,所以一月出生的人在一月份就可以走了,但六月出生的人必须要在学校待到六月,这样出生月份不一样的人结束教育的时间也不一样,但是他们开始教育的时间都是学校开学的时候。结果出生月份就会影响受教育时间的长短。于是这篇论文就用是否出生在第一季度作为教育时间的工具变量,发现用工具变量的结果和用OLS的结果没有显著区别。这个工具变量后来也受到了一些质疑,因为这是一个弱工具变量,出生月份对受教育时间的影响尽管存在但很小,这样即使出生月份和遗漏变量只有很微弱的相关性,估计结果也会有比较大的偏差。
最近又知道一个很有意思的。1998年AER的 Angrist&Evans 的Children and Their Parents Labor Supply: Evidence from Exogenous Variation in Family Size。这篇论文研究的是子女数目增加对父母劳动市场参与的影响。这里的问题就是找一个影响子女数目的外生冲击。这方面的研究有的用的是双胞胎,有的用的是流产失败。双胞胎的产生当然一般是随机的,而不是预料到设计出来的,所以这是直接增加子女个数的外生冲击。这篇论文考虑了一个间接增加子女个数的因素,就是头两个孩子的性别构成。这为什么会影响子女数量呢?他们的理论是这样的:父母一般希望子女的性别构成多样化,所以如果头两胎都是男孩或女孩,那么他们就希望再生一个性别不一样的,但如果前两胎一个男孩一个女孩,那性别多样化的任米乐M6 M6米乐务已经完成了,就不会再生了,所以前两个孩子性别一样的家庭会有更多的子女。我觉得这个思路确实很神奇。总之,找工具变量就是要开动脑筋,大胆联想。
我们可以把这篇论文放到更大的学术脉络中来看。一直以来,经济学家都想找到地区间经济绩效长期差异的决定性因素。一些经济学家认为可能是制度(North, 1981; Acemoglu, Johnson and Robinson, 2001,2004),另一些则认为地理因素更为基本(Diamond, 1997; Sachs and Warner, 1995, 1997)。关键是,在实证研究中我们很难测度制度、地理对经济增长的边际贡献。我们可以说,好的制度可以促进经济增长,也可以说,经济增长为制度构建提供了良好环境。
为了解决这一“内生性”问题,学者们就需要为制度找到合适的“工具变量”,这一变量要同时满足:对“制度”而言具有相关性,对“经济增长”而言又具有外生性。然后,我们就看到一系列很有意思的工具变量陆续米乐M6 M6米乐亮相了。
厦门大学王亚南经济研究院的方颖、赵扬(2011)梳理了经济学家们既往不断寻找制度“工具变量”的过程——
在西方历史中,不同的语言代表了不同的族源,从而有可能反映了不同制度的起源。Mauro(1995)利用这一差异作为各国腐败程度和政府效率的工具变量。
提到的Tabellini, Guido(2008)的成果可以视为是这一进路的延伸】。
Hall and Jones(1999)则把各个国家到赤道的距离作为制度的工具变量。他们认为到赤道的距离大致反映了各国受西方影响的深浅,从而可以反映不同制度的变化。但是,不少经济学家(Bloom and Sachs, 1998; Gallup, et al., 1998)认为各国到赤道的距离还同时通过气候和地理等因素影响到经济增长,从而不符合工具变量外生性的要求。
Acemoglu, et al. (2001)建议把欧洲早期殖民者在各殖民地的死亡率作为制度的工具变量。如果早期殖民者在某地的死亡率较低,他们就倾向于向该地区移民,从而建立起仿效母国的制度。反之,如果死亡率较高,他们则倾向于在该地区建立掠夺性的殖民政府,尽可能将该地区的资源转移到母国。即使这些殖民地陆续获得了独立的权利,但由于制度的持续性,独立后的政府在很大程度上会延续原先坏的制度。但是,Glaeser, et al, (2004)认为早期殖民者死亡率的分布和当代流行疾病的分布相关,从而无法区分究竟是制度还是地理性的流行病分布决定了经济增长。另一方面,早期殖民者的死亡率也反映了各地区移入的人力资本,而后者也可能决定经济发展的不同路径。
而方颖、赵扬《寻找制度的工具变量:估计制度效应对中国经济增长的贡献》这篇论文
主要贡献在于建立了中国地级市制度质量的工具变量,即以1919年各城市每千人中基督教教会初级小学注册学生人数作为制度的工具变量,并详细论证该工具变量的适用性。我们的研究发现,制度对于中国经济增长的边际贡献显著为正。如果制度的质量提高0.01,那么就可以提高该地区4.23%的Log人均GDP。在控制初始经济发展水平、历史人力资本、各类地理变量和政策变量后,制度对于经济增长的边际贡献仍然显著为正,而且其估计值表现出一定的稳定性。
中国政府于1992年开始实施一项规模宏大的“高速公路网”计划,对此,学术界就修建高速公路是否有助于边缘城市的发展并缩小区域间的经济不平等展开讨论。由于“修路”的决策具有“内生性”——被纳入高速公路网的边缘城市,与那些没有被纳入高速公路网的城市之间,可能原本就存在着各种各样的内在差异,“通过高速公路与中心城市连接”和“边缘城市经济发展”之间存在相关性关系,并不能推出修路促进了经济增长,有可能是中心城市本身就比边远城市有在政治地位、资源禀赋等差异造成的。所以,问题的关键在于找到一个合适的“工具变量”:这个变量只通过影响“边缘城市被纳入高速公路网”的概率来影响“边缘城市的经济发展”,而与其它不可观测的影响经济增长的因素全部无关。
加州大学伯克利分校的经济学家Benjamin Faber独具匠心地利用算法中的“最小生成树”这一概念来构建工具变量,并由此估计修建高速公路的经济影响。他的主要思路是:给定一些确定的点(50万人口以上大城市,亦即“中心城市”)必须被纳入这个高速公路网,不考虑其它因素,理论上可以计算出一个对应的“最小生成树”(可以理解为一种铺设方案),使得铺设高速公路的总成本最低。作为一个理性的决策者,在其它条件不变的情况下,肯定倾向于用这种成本低的方案。因此我们有理由相信,在其它条件不变的情况下,如果一个边缘城市的地理位置恰巧处于上述的“最小生成树”上,那么它最终被纳入实际的高速公路网的概率就比其它的边缘城市更高,而这种概率的差异又完全是由算法的结果客观地决定,不受其它人为因素的影响。
于是,作者以“边缘城市是否处于最小生成树上”作为工具变量,在因果推断的层面上估计出了高速公路对区域经济发展的影响。
具体的实证结果方面,作者发现“被纳入高速公路网”对于“边缘城市的经济发展”具有显著而稳健的负面作用:在1997-2006年间,其它条件不变的情况下,被纳入高速公路网的那些边缘城市,相比于其它边缘城市,其经济增长率平均要低18个百分点,而其工业总产值的增长率平均要低26个百分点。
通过对几个推论的验证与分析,作者进一步确认,高速公路之所以会对边缘城市产生如此巨大的负面经济影响,主要原因是高速公路导致地区间运输成本下降,从而导致边缘城市的工业经济不断向中心城市聚集。