作者王岳龙 香樟经济学术圈
【论文信息】
NATHAN NUNN AND NANCY QIAN “THE POTATO’S CONTRIBUTION TO POPULATION AND URBANIZATION: EVIDENCE FROMA HISTORICAL EXPERIMENT”
The Quarterly Journal of Economics (2011)126, 593–650.
一、引言
公元1000-1900年间,全世界的人口从3亿增加到16亿,城市人口比例也从2%增加到9%,这种飞速增长势头随着时间推移也变得越来越快,这个现象引起了大量经济学家、人口学家和历史学家的关注。作者从哥伦布15世纪末发现美洲新大陆(the new world),将当地特有的土豆带回欧洲,并在1700年前后成为欧洲各国的主食,随后又通过欧洲人的海上贸易进一步推广到亚洲、非洲(theold world)。
作者认为土豆的引入,作为农业生产率提高的标志,能提高人民的生活水平进而提高居民的预期寿命,从而导致人口增加;而土豆引入对城市化的影响主要通过如下2个可能机制:首先土豆引入作为一种农业生产率的正向冲击改变了农业部门和工业部门的相对收益回报率,影响了从事农业生产的劳动力数量。为此作者通过一个简单的理论模型证明了:只要农产品是缺乏需求价格弹性的,农业生产率的增加就会减少农业部门的劳动力数量,从而使更多的农业剩余劳动力涌入城市;其次土豆的引入加强了城市化与人均收入的关系,Galor and Weil(2000)将经济增长分为马尔萨斯时期、后马尔萨斯制度、现代制度。在马尔萨斯时期,虽然生活水平暂时有所提高,但是正的生产率冲击长期中完全被效率增加所抵消,从而导致稳态人均收入的不变与人口增长,这段时期结束于19世纪。始于19世纪和20世纪初的后马尔萨斯制度,由于正的生产率冲击长期中不能完全被效率增加所抵消,在长期中就会导致人均收入(也就是城市化)的提高,而不会被人口增长所抵消,这就是经济增长中的规模效应;始于19世纪末欧洲和20世纪后期亚洲和拉丁美洲的现代制度,正的生产率冲击反而会对效率和人口产生负向影响。
二、主要结论与研究意义
本文研究发现oldworld中那些更适合土地培育的地区在引入土豆后经历了更快的人口增长和城市化,而且这个结论是对于不同控制变量和样本是高度稳健的。基于基准模型的反事实计算结果显示,土豆引入解释了old world国家在1700-1900年间人口增长的25-26%。城市化比重提高的27-34%。
本文的结论在以下三个方面丰富了现有的研究:首先提供了营养改善和死亡率下降和预期寿命增长的经验证据;其次有助于理解农业生产率提高和经济增长(通过城市化表示)之间的关系;最后有助于认识到哥伦布发现美洲新大陆对old world生活水平改善的重要性。
三、识别策略
由于反向因果和遗漏变量的原因,实证研究土豆引入与人口增长关系的难度在于土豆引入是内生决定的。Mokyr(1981)是目前可以查到的唯一一篇试图识别土豆引入和人口增长因果关系的文献,作者采用1845年爱尔兰的数据采用联立方程估计了两者之间的关系,利用人均收入(捕捉需求特征)、资本劳动比(捕捉供给特征)、海拔的标准误和现阶段不可耕作但是经过改良将来可用于耕种的土地比例(捕捉地理特征)作为土豆培育量的IV,结果发现土豆培育确实显著提高了人口数量,但是反向作用不明显。
本文的两位作者扩展了Mokyr(1981)的研究,除了研究样本扩展到整个old world在18-19世纪的情况,研究对象也不仅仅局限在人口数量,而进一步发展到对城市化、城市增长和成年人身高的影响。本文的识别主要依赖于两个层面的变动:第一是时间层面上的,old world各国在引入土豆作为本国主要农作物的时间是不同的,土豆首先是在17世纪末和18世纪初在欧洲流行,然后进一步流传到剩下的亚洲和非洲,在背景中作者对这个流传进程作了详细交代;第二是横截面层面的,old world各国在土豆耕作的适宜性上是不同的,这些随时间不发生变化的地理气候因素也会对人口增长产生重要影响。然后利用这二者变化的交乘项来识别土豆引入和人口增长、城市化之间的因果关系,这种类似DID的估计方法在随后2位作者合作的另外一个论文《US Food Aid and Civil Conflict》(American Economic Review 2014)也被用来构造粮食援助的工具变量,即用前一年美国的小麦产量(时间变动)乘以各受援助国在过去36年里面接受援助的次数比例(横截面变动)。
这么做的好处在于:一方面通过控制国家和时间的固定效应,可以捕捉各国随时间不变的地理、食物偏好、制度等特征,以及捕捉全球在健康、卫生的改善和技术进步这些随时间变化的因素。另一方面本文的这个估计策略依赖于适合培育土豆的国家在引入土豆的这段时期不受其他的外部冲击影响。为了克服这个问题,本文在基准模型中直接控制了随着国家和时间同时变化的影响人口增长和城市化的变量。基准模型如下所示
采用的样本是old world(主要是除南北美洲以外的欧洲、亚洲、非洲、大洋洲)130个国家在公元1000、1100、1200、1300、1400、1500、1600、1700、1750、1800、1850、1900年这12个时期的数据。其中yit是人口数量的对数或者城市人口比重。根据FAO(食物和农业组织)2002年公布的一组关于old world各国平均气温、降水天数、阳光、大气压力和风速等气候数据集,来计算1900年之前各国土豆培育适宜性的指标,其值可以分为5类:0.8-1表示非常适合;0.6-0.8表示适合;0.4-0.6表示一般适合;0.2-0.4表示边际适合;0-0.2表示不适合。各国非常适合、适合和一般适合这三类土豆培育面积总和即为Potato Area。IPOST是时间虚拟变量,因为土豆的引入是发生在17世纪末和18世纪初,所以IPOST在1750、1800、1850、1900各年取1,其他各年都为0。Xi是一组地理和历史控制变量,如海拔、地形和热带面积等。这些变量都是基于某一年的截面数据,为了体现面板数据的特征,本文都将其与各年度时间虚拟变量Ij进行交互。aI 和gt是相应的国家和时间虚拟变量。
基准模型中估计的β是土豆引入对人口和城市化的平均处理效应,由于各国引入土豆的时间不一致,不同时间段土豆引入对人口和城市化的影响可能有所不同。为了估计这种异质性影响,作者又估计了如下模型:
如果土豆引入会增加人口和城市化比重,那么在土豆实际引入期(1700年)之前各年的系数应该保持一致,在1700后各年系数会逐年增大,即
四、稳健性分析
为了验证模型在时间分割点上的稳健性,本文以每300年为一个窗口(如1200-1500、1300-1600…),每个窗口的后200年作为土豆引入期,对基准模型进行了基于rolling estimation的安慰剂检验。
为了验证确实是土豆而不是其他农作物引入导致人口增长和城市化比重提高,作者又引入了Maize、Silage Maize、Sweet Potatoes三种可能的农作物作为控制变量,仍然是采用适宜耕种面积对数与年度虚拟变量乘积形式,结果没有发生明显变化。
1700年以后,由于工业革命等原因使西欧经济社会状况与其他旧世界国家逐渐拉开了差距,而这也正是西欧国家开始引入土豆的时间,为了排除诸如工业革命的影响,本文在基准模型基础上通过采用控制洲固定效应的办法,控制影响西欧与其他国家拉开差距的随时间不变因素。为了更好的考察洲内国家的变动,还采用了各国4万和1000以上人口的城市作为样本进行检验,结果仍然高度稳健。
为了避免遗漏变量的影响,作者还进一步控制了影响人口和城市化的一些重要解释变量,如到赤道和海岸线距离的对数、MalariaIndex等。同样对关键解释变量Potato Area还采取了其他几种度量形式,都不改变基准模型的结果。最后作者认为距今久远的历史数据可能存在的系统性测量误差,可以通过本文的双固定效应予以控制。
五、一些思考
本文是我精读过的Nancy Qian继《Missing Women and the Price of Tea in China: TheEffect of Sex-Specific Earnings on Sex Imbalance》(The Quarterly Journal of Economics, 2008)以及《US Food Aid and Civil Conflict》(American Economic Review,2014)后的第三篇经典论文。纵观这三篇发在当今最顶尖经济学期刊上的论文,堪称当今国际实证研究主流—识别变量间真实因果关系的范本,具体有以下几个方面的共同点:
一.以小见大,从一个很小的现象经过层层剥茧最后牵出一个大问题。特别明显的是Missing Women一文,本质是研究经济发展水平对性别比例的影响,作者并不是简单的拿男女性别比对GDP回归,而是通过借助产粮区和产茶区茶叶价格的不同导致不同地区间女性价值的差异,因为产茶区茶叶价格较高,而女性由于生理原因从事茶叶生产具有比较优势,因此该地区就不大可能遗弃女婴。因此借助于外生自然条件形成的产茶区和产粮区这个准自然实验,识别出了经济发展水平与性别比之间的因果关系。同样potato一文也是把土豆的引入视为一种外生的农业生产率冲击,通过在不同地区土地适宜性的不同和引入时间的先后这双重差异来识别其对人口数量和城市化(经济增长)的影响。从小小的土豆和茶叶出发,最后上深到性别比例失调和城市化这样的社会重大问题,中间这种人为将因果关系链条拉长的做法,一方面理论上有创新,中间的传导机制就是所谓的经济学故事和政策含义所在。另一方面正是由于两者之间的因果关系链条很长,自然反向因果关系也不明显,这样在技术上有效克服了内生性。
二.都体现了“重要的问题、简单的方法和干净的识别策略”这个现在一流实证论文的共同特征。三篇文章分别研究性别比例失衡、国家稳定和城市化(经济增长)这三个重大经济社会问题,采用的无一例外都是基于最简单的OLS方法,甚至在Food Aid一文中因变量是0、1变量,也没有采用基于MLE的probit或者logit模型。potato一文中控制变量由于是时间久远的历史数据,而很难获得连续变化的面板数据,所以假定各个体随时间不变而体现为截面数据特征,作者也没有采用Hansman-Taylor这种可以估计非时变面板数据的特殊方法,而是通过与各时期虚拟变量交乘转化为时变的标准面板数据。logit、hausman-talor这些较为复杂方法由于有着更为严格的假设条件,现实条件往往很难满足,因而在应用中其实是非常有害的方法。而OLS由于有着最宽松的假设条件,因而成了目前国际主流期刊里面最常用的方法,这也是为什么最近最流行的应用计量教材—angrist的《most harmless econometrics》,该书只讲OLS和以此为基础引申出来的IV、DID和RD估计方法的原因。具体到识别策略,这三个论文都是通过寻找一个外生冲击在样本个体和时间两个维度上的变化,通过DID或者IV来识别因果关系,特别是food Aid一文中通过前一年美国的小麦产量(时间变动)乘以各受援助国在过去36年里面接受援助的次数比例(横截面变动)这种交乘项构造IV的方法,也为我们以后寻找合适的IV提供了一个新的思路。
三.近乎极致的稳健性分析体现了作者严谨的治学态度和深厚学术功底。通过不厌其烦的改变变量和数据进行反复回归,把你能想到和没有想到的干扰因素逐一排除,这是nancy qian的三个论文给我的一个很深刻的印象。正如前面稳健性分析总结的,为了排除几乎同期发生的工业革命对西欧各国与old world各国拉开差距的影响,作者通过采用控制洲固定效应的办法,从而控制住了影响西欧与其他国家拉开差距的随时间不变因素。为了验证是土豆而不是其他农作物的引入导致了人口增长和城市化,作者又引入了Maize、Silage Maize、Sweet Potatoes三种可能的农作物作为控制变量。同时对由于时间久远的历史数据可能产生的测量误差而导致内生性问题,作者也给出了相应的解决办法和解释,这些细节都是非常值得我们学习的。
Abstract:We exploit regional variation in suitability forcultivating potatoes, together with time variation arising from their introductionto the Old World from the Americas, to estimate the impact of potatoes on OldWorld population and urbanization. Our results show that the introduction ofthe potato was responsible for a significant portion of the increase inpopulation and urbanization observed during the eighteenth and nineteenthcenturies. According to our most conservative estimates, the introduction ofthe potato accounts for approximately one-quarter of the growth in Old Worldpopulation and urbanization between 1700 and 1900. Additional evidence fromwithin-country comparisons of city populations and adult heights also confirmsthe cross-country findings
本文精选自“香樟经济学术圈”微信公号,更多精彩内容,请移步我们的公号,请扫描下方二维码
0
推荐