图片来源:百度图片
原文信息:
Bell, Alex, et al. "Who becomes an inventor in America? The importance of exposure to innovation." The Quarterly Journal of Economics 134.2 (2019): 647-713.
01
引言
创新被广泛地认为是经济增长的长期引擎[Romer 1990, Aghion and Howitt 1992],从减税到对STEM教育的投资,很多公共政策被政策制定者用来刺激创新,本文作者另辟蹊径,从研究个人成为发明家的决定因素入手,去理解政策的有效性:现如今,什么类型的人会成为发明家?人所经历的环境又会如何决定一个人成为发明家的概率?作者匹配了全样本的专利数据和税收数据,利用行政大数据追踪到了120万发明家,并且追踪到他们从出生到成年的生命周期历程,以确定决定谁能成为发明家的因素,政策制定者可以根据这些因素去理解政策,为下一步制定政策提供参考。
作者通过对个人背景的分析,发现成为发明家的概率在具有不同父母收入、性别和种族特征的群体上差异巨大,而一个人能成为发明家的概率也与其所经历环境有关。政策制定者若想找回“迷失的爱因斯坦”,一个有效的政策渠道(pipelines)就是有针对性地提高个人在创新环境中的“熏陶”力度(exposure)。本文的研究也呼应了早先利用欧洲数据去考察科学家供给因素的文献[Toivanen & Vaananen 2012, 2015; Jung and Ejermo 2014; Depalo and Di Addario 2015; Bender et al. 2015; Aghion, Akcigit, Hyytinen, & Toivanen 2017]。
数据
02
如图所示,作者梳理了一个人从出生到成年的生命周期历程,利用行政数据,本研究可以非常方便地追踪发明家出生特征、幼年环境和成年产出的情况,本文所用的数据主要有以下几个来源:
(一)专利数据
专利记录从两个来源获得。首先,作者使用来自谷歌托管的数据库的专利授权信息,该数据库包含所有已授权专利的全文,搜取了从1996年至2014年间授予美国居民的170万项专利。除了已经授权的专利,作者使用了Strumsky(2014) 提供的2001年至2012年间160万项专利申请的数据。下图所示专利申请的目录,从这之中可以搜集到发明家的姓名、专利授予的特征、类型等变量。
(二)所得税数据
数据涵盖了1996-2012年期间出现在任何税单上的所有美国人,这些数据也包括所得税申报表(1040张表格)和第三方信息申报表(如W-2表格),它们为我们提供了那些没有申报纳税申报表的人的收入信息。
(三)匹配数据
专利数据按专利申请时的发明人姓名、城市和州与税务数据相匹配,86% 的发明家被成功匹配到税收数据当中。匹配数据中有1,200,689 个发明家。
03
家庭背景的影响
本文首先考察父母特征对子女成年后成为发明家的影响。本文将父母和子女匹配(父母在报税时申报自己抚育年幼子女可以获得税收优惠,借助该申报信息可以将父代和子代匹配),由于子女成年后(16岁后)便不再申报,而税收数据最早到1996年,作者只能追踪到1980年后出生的子代,这迫使本文只能研究年轻的发明家(在2012年32岁内),虽然样本有所局限,我们仍然在数据内观察到34,973位发明家。本文作者为了检验结论的稳健,在后文用美国统计局0.1%抽样调查的样本观察40岁内的发明家,发现了相同的规律。在散点图中,作者横轴为由低到高排列的父母家庭收入的分位数,纵轴是每个分位数家庭中培养发明家孩子的比例(每千个小孩有几位发明家)。散点呈现指数增长趋势,最富裕(最右边1%分位数)的家庭中每千个小孩中有平均8.3个发明家,中位数左侧家庭每千个小孩只有0.84个发明家,差距近十倍。
接着,一个问题是:为什么专利申请率随着父母收入发生变化?作者列举了三种主要的潜在机制:
1,先天禀赋:来自高收入家庭的孩子可能有更大的创新才能
2,偏好差异:早期财务约束形塑后天风险规避偏好,同能力的低收入儿童更喜欢其他职业(比如医生和律师)。
3,资源约束:低收入家庭的孩子有类似的天赋和偏好,但面临更高的进入门槛或缺乏接触创新的机会。
区分这些解释的第一步是:用纽约公立学校所有孩子的考试成绩数据来衡量他们的能力[Chetty, Friedman, Rockoff 2014]:作者采用了1989-2009年全州标准化考试中3-8年级的数学/阅读成绩,使用1979-85年出生队列的43万名儿童的数据进行分析。一个基本的想法就是早年的数学成绩是个人先天能力的较好度量,在给定数学成绩相同的情况下,如果成为发明家的概率仍然与家庭经济社会特征有关,渠道一的解释就不足以信服。由下图可知, 作者追溯到纽约州发明家早年的数学成绩,发现随着标准化成绩的提高,成为发明家的概率确实有显著提高,但家庭父母收入分位数高于第80分位数的家庭在成绩分布右侧的增幅要显著高于较贫穷家庭,说明能力不是导致专利申请率随着父母收入发生变化的最主要因素。接着作者又给出了不同种族、性别的折线图,重复分析,以评估不同性别、种族之间的差距,进而证明了相同才能的群体在不同背景家庭中的资源错配。
发明家的生命周期
04
(一)童年环境的影响
作者首先描述儿童时期接触创新环境对于创新倾向的重要性:通过父母、朋友或邻居接触到创新的孩子更有可能获得专利吗?作者发现,父母是发明家的儿童(每千人18人)在长大后作为发明家的概率是父母不是发明家的儿童(每千人2人)的6倍。一个自然的问题是:“子承父业”到底是因为遗传还是环境的作用呢?作者巧妙地解决了上述问题,试考虑下面两种论述:
“我父亲擅长机械设备,所以我遗传了我父亲的能力,也擅长机械设备”
“我父亲擅长制备路由器,所以我遗传了我父亲的能力,也擅长制备路由器”
显然,用基因遗传去解释第一种说法是较为合理的,第二种说法是略有荒谬的,作者的方略就是按狭义技术类别分析专利倾向,将专利类型精确到“制备路由器”这一精确的分类中,如果“子承父业”只在精细的分类中存在,就说明不是基因的作用。作者根据拥有两个技术类别专利的发明者的比例,定义两个技术类别的“相似性”。由下图可知,随着与父亲所处技术门类(technology class)的距离扩大,在图最左边,成为发明家的概率有显著的下降,这证伪了基因假说。
为了排除父母直接投入的影响,接着作者将样本限制在父母不是发明家的子女当中,然后观察父母在创新行业工作的孩子是否拥有更高的专利率? 下表第一列是行业(industry)层面的回归,父亲所处行业的发明家越多,子女成为发明家的比例就越高;第二列将行业细化到目录(category),结论一致,第三列继续将门类细化为子目录(sub-categories),系数依然稳健;第四列的回归更一步的细化化为技术门类(technology class),系数较(1)至(3)列略低,但仍然显著;第五列控制了子目录、目录后仍然显著。
(二)邻里效应
接着,作者分析社区的影响。按儿童成长的通勤区(CZ, 类似于都市区的县的集合)算出专利率(不同于关于创新集群的文献,因为这并不一定是他们成年后生活的地方),如下图所示:
如下图所示,该效应仍然是只在相同技术门类内显著:纵轴是各类技术门类对与之特定距离的其他技术门类专利率的回归系数,该系数随着技术距离的增大在0-1间迅速降低。说明这种邻里效应也不是由基因遗传造成的。
下表中第二列从左向右不断细化专利分类和固定效应,在第(8)列,在控制科技门类(technology class)固定效应和专利是否在同一目录和子目录内的情况下,结果显示,幼年成长地区特定科技门类专利申请率提高1单位,成年后个体专利申请在该门类专利率提高1.05单位。正文中作者也考虑了迁移样本,进行了稳健性检验。
作者还进一步分析发现,相关的邻里效应是在不同性别内有效的(gender specific):女性发明家只对女孩有影响(1.5),男性发明家只对男孩有显著影响(1.1)。
05
总结
本文利用行政数据和专利申请大数据,创新性地追踪了专利申报人(发明人)的生命周期历程(从出生到成为发明家),研究了成为发明家的决定因素:其一、家庭背景是重要的,性别、种族和父母收入是影响专利申请率的重要因素,要找回“遗失的爱因斯坦”,就要关注低收入家庭的、女性的、有色族裔的较高禀赋儿童;其二、环境是重要的,早年暴露在创新环境中可以提高成年后申报专利的概率,值得注意的是,女性更容易受到女性发明家的影响。
Abstract
We characterize the factors that determine who becomes an inventor in the United States, focusing on the role of inventive ability (“nature”) versus environment (“nurture”). Using deidentified data on 1.2 million inventors from patent records linked to tax records, we first show that children’s chances of becoming inventors vary sharply with characteristics at birth, such as their race, gender, and parents’ socioeconomic class. For example, children from high-income (top 1%) families are 10 times as likely to become inventors as those from below-median income families. These gaps persist even among children with similar math test scores in early childhood—which are highly predictive of innovation rates—suggesting that the gaps may be driven by differences in environment rather than abilities to innovate. We directly establish the importance of environment by showing that exposure to innovation during childhood has significant causal effects on children’s propensities to invent. Children whose families move to a high-innovation area when they are young are more likely to become inventors. These exposure effects are technology class and gender specific. Children who grow up in a neighborhood or family with a high innovation rate in a specific technology class are more likely to patent in exactly the same class. Girls are more likely to invent in a particular class if they grow up in an area with more women (but not men) who invent in that class. These gender- and technology class–specific exposure effects are more likely to be driven by narrow mechanisms, such as role-model or network effects, than factors that only affect general human capital accumulation, such as the quality of schools. Consistent with the importance of exposure effects in career selection, women and disadvantaged youth are as underrepresented among high-impact inventors as they are among inventors as a whole. These findings suggest that there are many “lost Einsteins”—individuals who would have had highly impactful inventions had they been exposed to innovation in childhood—especially among women, minorities, and children from low-income families.
声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。
0
推荐