财新传媒 财新传媒

阅读:0
听报道

图片来源:ChatGPT

文献来源:

Hunt, J., Cockburn, I. M., & Bessen, J. (2024). Is Distance from Innovation a Barrier to the Adoption of Artificial Intelligence? (No. w33022). National Bureau of Economic Research.

01

引言

地理距离对技术知识传播和创新的影响一直是人们所关心的议题,在传统研究中,已经充分关注了距离对于发明和研究活动扩散的重要性,距离可能会减少偶然会议的可能性、提高了计划会议的成本,使得合作的机会更为稀缺、成本更为昂贵,进而降低了发明家和研究人员获取知识或合作的能力。此外,由于知识随研发人员在不同公司之间的转移也会受到距离的影响,这也导致距离成为影响创新扩散的重要因素。然而技术的快速进步,特别是包括电话、现代交通工具、电子邮件、短信、网络和视频会议在内的技术进步,可能会减少距离对知识扩散的影响。一些论文表明,跨地点的合作因差旅时间更短、成本更低而增加,尽管是否开启合作似乎仍与距离紧密相关(Catalini ,2018)。对于技术采用而言,相关的文献认为距离是重要因素。一方面,对于潜在的技术采用者而言,靠近技术的早期使用者能够降低其风险,并从早期采用者那里挖走有经验的工人。此外,企业可以通过贸易或者直接投资来获取技术,而距离有可能成为障碍。

本文以人工智能作为关注对象,主要考察距离是否构成了技术创新的障碍。选择AI的原因一方面是作者撰写本文初稿时,相关领域的研究论文和专利刚刚开始快速增长,这使得考察其早期的地理扩散成为可能。同时也考虑到AI在未来极有可能成为社会发展趋势(正如我们现在所看到的那样)。本文的研究贡献主要集中在以下几点:第一,是在少数研究创新和地理联系之间首个明确研究距离的,也是在大量研究知识扩散的文献中第一个比较科学论文和专利角色的;第二,本文创建了一个AI出版物数据集,并使用在线职位空缺信息来衡量AI的采用情况;第三,本文在机制上发现,行政边界(州界)可能会削弱区域吸引来自高创新区域的AI工人的能力,减缓现有公司中的AI创新和适应。

02

数据

本文使用Microsoft Academic Graph的数据,编制了一个涉及机器学习和神经网络的期刊文章、会议论文和专利的数据库。每个作者的位置都匹配到城市级别。按年份将论文和专利汇总到741个通勤区域,每个作者都是潜在溢出的来源。本文尝试使用不同的绝对阈值,来指定某些通勤区域为创新热点(Hotpots)。职位广告数据来自Lightcast,通过关键词筛选得到与AI相关的广告信息,并从便利性的角度,检查了下述三个类别:没有指定的AI技能的岗位要求、图像处理类的岗位要求和对其他AI技能或技能组合的要求。本文的主要因变量为,表示通勤区域c内AI工作需求份额在t-k到t时间内的变化,其中距离通勤区域c最近的创新热点位于通勤区域h。

03

实证策略

本文估计了距离最近的AI出版物热点对AI工作份额增长的影响,并区分了基于论文和专利热点的距离,同时评估了不同大小的热点对距离的影响,还区分了距离对AI创新与AI采用的影响。最后,分析了可能的机制。3.1 基准回归

其中,t*表示在2007年或之前测量的变量。本文感兴趣的变量是,其衡量了距离是否构成招聘AI员工的障碍。为了避免异常值的情况,本文选择更长的时间差异、采用中位数回归等方式进行分析。作者引入了大量的控制变量,捕捉通勤区域自身的AI创新的情况、热点区域出版物的情况、附近高人口区域的影响、区域的初始条件、其他可能与距离最近的热点混杂的距离影响以及一些关键变量的同期变化。3.2 区分论文和专利热点在基准回归的基础上,本文进一步区分了论文热点和专利热点对AI工作份额增长变化的影响。热点即论文或专利数量超过一定阈值的区域。

3.3 区分不同大小的热点

此外,本文探讨了不同阈值的出版物、论文或专利热点的影响。下述模型区分至少有100篇论文的热点和至少有1000篇论文的热点的距离的影响。

需要注意的是,到更高阈值热点的距离平均来说比到更低阈值热点的距离要长,因此距离的影响是通过两组热点在不同距离上的变化来识别的,这造成了一定的内生性问题。尽管不能完全克服这个问题,但可以通过多种方式进行稳健性估计。本文选择基于一个较低的阈值来定义热点,然后交互距离到最近的热点与热点中的出版物数量。如果交互项的系数是负数,这意味着当从两组热点的相似距离进行识别时,与较大的热点距离较远比与较小的热点距离较远更抑制AI工作增长。

3.4 区分距离对AI创新与AI采用的影响

作者进一步分析距离究竟是对AI创新还是AI采用有影响。本文按行业和职业分析距离对AI职业需求份额的影响,并分别检查距离对不同AI类型的影响。

04

描述性统计

AI职位广告在2007年到2018年迅速增长,在所有广告的份额中也呈现迅速上升的趋势,反映AI的高速发展以及对相关从业人员需求的快速增加。

                                     

下表展示了关键统计变量的描述性分析。面板A指出三年AI职位广告增长的平均值为0.06个百分点,而中位数增长仅为0.03个百分点。最小值为-2.46个百分点,最大值为4.70个百分点,证实了上述异常值的存在,也反映了本文异常值处理的必要性。平均七年增长为0.14个百分点,中位数增长为0.09个百分点。三年差异观察中,AI增长为正的比例为63%,七年差异为75%(面板B),表明增长是普遍情况。

本文使用的其中一个关于创新热点的定义是到2006年至少有1000篇累积出版物。三个顶级AI出版物热点是洛杉矶、波士顿和华盛顿特区附近的阿灵顿,每个都有超过6000篇出版物,其次是纽约、匹兹堡和圣何塞,每个都有超过4000篇出版物。一些热点是公认的技术开发中心,其他是大学城,还有一些是军事活动的中心。下图显示了每个通勤区域到其最近热点的距离,从空间上对创新热点的分布有更加直观地呈现。

05

结果分析

5.1 距离最近热点对所有AI职位广告的影响

下表面板A中呈现了与热点的距离对AI职位广告增长影响的估计,其中热点定义为至少有1000篇出版物(论文和专利)的通勤区域。表中所有回归都是中位数回归。第1列只包括了年份虚拟变量和与最近热点的距离。系数结果为-0.149且统计显著,这表明,距离增加1000公里会使AI职位广告增长减少0.149个百分点。在第2列中加入通勤区域2007年之前AI论文和专利信息以及其热点的2007年之前论文和专利信息时(控制两个区域的初始情况),这一系数上升到-0.099。该系数在加入更多控制变量的情况下表现得相当稳健:第3列包括了其他关键变量的初始条件;第4列包括了到最近人口众多通勤区域的距离和其人口的二次项;第5列包括了到其他通勤区域的平均距离、到最近通勤区域的距离和最近通勤区域的人口;最后,第6列包括了关键协变量的七年差异。尽管加入这些协变量可能看起来像是过度控制,但它并没有太大影响系数,同时确保了稳健性。到最近热点的距离的标准差是207公里,因此由第6列系数可以得到,由于距离增加200公里导致的AI职位广告份额增长的-0.016个百分点的影响,大约是中位数七年增长0.094个百分点的17%。在面板B中,作者考虑了到基于论文的热点的距离,结果与面板A中出版物热点的结果非常相似。这是因为大多数出版物是论文。在面板C中,作者转而考虑了到最近至少有20项专利的基于专利的热点的距离。选择这个专利阈值是因为到最近至少有20项专利的热点的平均距离与到最近至少有1000篇论文的热点的平均距离相似。在面板D中,作者同时控制了距离论文和专利热点的距离。第1列中两个距离的系数比单独包含每个距离时的系数要小,并且彼此大小相似(-0.082和-0.074)。但是随着其他控制变量的加入,基于专利的热点的距离的系数变得统计上不显著,且要小得多。因此,仅关注AI专利的外溢效应或其他地理方面的研究可能主要捕捉到的是AI论文的影响,可能高估AI专利的影响效果。


5.2 区分AI创新与采用的距离影响

在建立了从AI论文热点地区较远的通勤区域有更慢的AI职位广告增长之后,本文进一步深入研究是什么驱动了这一点,并判断更慢的增长是代表了AI的创新增长更慢,还是代表了更慢的AI采用。作者首先分析了不同行业AI职位广告份额增长的情况。金融和保险行业的AI职位广告份额的七年增长最快,第三快的AI增长是在包含房地产、专业和科学服务以及管理的类别中。只要职业不是由在信息部门工作的员工机构发布,这代表了技术采用。信息部门即创新将发生的地方,AI职位广告增长第四快。下表按行业估计了到最近1000篇出版物热点的距离的影响。对于大多数行业而言,中位数变动不大,因此采用OLS回归。对于那些可以进行中位数回归的行业(第2列),估计的系数在统计上是显著的,并且比OLS(如所有行业一起)小得多。在最后两列中,估计了AI职位份额有任何增长的概率。值得注意的是,信息行业的点估计在所有行业中是比较小的并且统计上不显著。对于所有行业,第3列中的-0.17系数意味着1000公里的距离增加减少了17个百分点的AI职位广告增长概率。按行业的分析支持了距离是AI技术采用或适应的障碍的假设,而不是AI创新的障碍,因为信息行业的系数在统计上都不显著。

本文进一步进行了职业的异质性分析。比较特殊的是,网络管理员(Network and Computer administrator)很少使用AI,但他们一般被期望使用AI。这个职业的系数是正的,甚至在两列中统计上显著。显然这是一个距离不减少AI采用增长的案例。总的来说,按职业的结果为距离是AI创新和适应的障碍提供了证据,但是笔者认为本文在此处的因果关系并不是很明确,似乎没有很清晰地区分AI创新和AI采用或适应。


5.3 机制分析

本文尝试探索使地理距离影响AI创新的具体机制。在第2列和第3列中检验了距离可能影响差旅通勤的时间并进而影响创新,结果显示该假说并不成立。第4列检验了时差对合作的影响,结果同样不显著。第4列同时检验了移民和研究人员的迁移对AI职位广告增长的影响,但是这一个机制在实际的分析中可能并不是特别重要;而公司间的信息流动能够显著促进AI创新或采用。在第4和第5列中,作者发现州界对创新的可能影响。在第1列的估计方程基础上,引入了用于表明通勤区域和最近热点是否在同一州的虚拟变量,发现当两者在同一州时,七年AI职位广告份额增长高出0.034个百分点,或中位数增长的36%。在第6列中作者继续添加了一个虚拟变量,用于表示该州是否有任何1000篇或更多出版物的热点;在第7列中进一步控制了除了旅行时间之外的所有与机制相关的系数,第8列加入了时间(但是由于非常难解释,所以作者未在此过多停留)。这些结果似乎排除了下述假设,即因为减少了合作,与最近的热点的距离是人工智能创新和使用的阻碍。具有最大解释力的假说是通勤区是否与最近的热点位于同一州。州界可能通过阻碍移民进而阻碍隐性知识流动。

06

结论

本文证明了在2007—2019年期间,距离已建立的AI创新热点地区更远的美国通勤区域在AI相关工作的增长上更慢,无论是AI研究还是适应AI的新用途。距离最近的热点地区每增加200公里,通勤区域的七年AI工作增长就减少了19%的中位数增长。这种影响是由距离AI科学论文热点地区而非AI专利热点地区所驱动的。由于两个距离之间的正相关性,当忽略论文热点时,距离对专利热点的影响似乎更为负面。这表明,仅关注AI专利的外溢效应或其他地理方面的研究可能错误地将科学论文的影响视为专利的影响。按职业和行业的分析表明,距离对于减缓AI创新和AI适应新用途很重要。机制上,本文尝试说明距离并不是通过使面对面或远程合作或网络变得困难来减少AI工作增长。本文发现,20%的影响可以通过通勤区域与它们的热点位于不同州的来解释。由于美国人不愿意跨州移动,这可能反映了从热点地区聘请AI专家的困难,这一方面可能减缓了现有公司的AI工作增长,另一方面可能阻止了希望使用AI的新公司在通勤区域设立。而进一步细致的分析需要更加细颗粒的移民数据来证明。

 Abstract 

Using our own data on Artificial Intelligence publications merged with Burning Glass vacancy data for 2007-2019, we investigate whether online vacancies for jobs requiring AI skills grow more slowly in U.S. locations farther from pre-2007 AI innovation hotspots. We find that a commuting zone which is an additional 200km (125 miles) from the closest AI hotspot has 17% lower growth in AI jobs' share of vacancies. This is driven by distance from AI papers rather than AI patents. Distance reduces growth in AI research jobs as well as in jobs adapting AI to new industries, as evidenced by strong effects for computer and mathematical researchers, developers of software applications, and the finance and insurance industry. 20% of the effect is explained by the presence of state borders between some commuting zones and their closest hotspot. This could reflect state borders impeding migration and thus flows of tacit knowledge. Distance does not capture difficulty of in-person or remote collaboration nor knowledge and personnel flows within multi-establishment firms hiring in computer occupations.

本文作者:王奕东,中国人民大学统计学院2021级本科生

声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点。

话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1709篇文章 3小时前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章