阅读:0
听报道
推文人 | 徐剑锋
原文信息:Heidi, Williams, (2013), Intellectual Property Rights and Innovation: Evidence from the Human Genome,Journal of Political Economy 121(1): 1-27.
1.简介
专利保护的用意在于通过保障创新者的利益来鼓励创新,但是专利保护期内使用知识产权的高昂成本也可能会阻碍某项知识产权的使用和继续创新。后面这个机制的实证检验工作是稀缺的,因为自然实验非常难找。举例来说,瓦特发明/改良蒸汽机后,英国并没有立刻进入蒸汽时代,等到瓦特的专利到期后,蒸汽机才遍地开花。如果瓦特不申请专利,英国会不会更早进入蒸汽时代呢?这很难回答,我们无法排除英国当时的社会文化经济因素的影响,可能当时英国的工业还没有足够的需求,或者维护蒸汽机的技工非常稀少,即使瓦特开放专利,蒸汽时代也不会在1776年开始。
创新没有独特性就不叫创新了,实证工作需要足够样本量的一大群相似创新,相似属性但是有专利授权有差异,可见其难。人类基因组测序竞赛给我们提供了这个机会。人类基因组计划(HGP)从90年启动,预计花15年时间,30亿美元,跨国协作,测定人类的全基因组。1998年,公众资金支持的科研机构正在不紧不慢的测序时,利欲熏心的疯狂科学家Craig Venter拉到一大笔私人投资成立了Celera公司,宣称只用3亿美元在三年内完成测序,给基因申请专利,从此以后坐收授权费,薅全人类的羊毛。在Celera抢注专利的威胁下,HGP也加速了,最终2001年2月,HGP在Nature发布了人类基因图谱(90%),同时Celera在Science也发布了差不多精度的图谱,竞赛(在美国政府的干预下)以平手告终。
HGP测定的基因序列会立即公开,而Celera测定的序列则保密,需要授权使用(科研教育免费,商业使用收费)。从1999年开始到2001年停止测序,Celera声张持有过1682个基因的IP,占总基因数27882的6%。2001年Celera停止测序后,HGP继续干到2003年4月,把所有基因包括Celera 测过的都测了,至此Celera的IP失效。作者的论文发现,即使Celera只持有IP相当短的时间,Celera持有过的基因其后续的跟进研究和成果转化远低于该公司未曾染指的基因:Celera持有过的每个基因累积到2009年有1.2篇相关论文,而非持有的基因有2.1篇;持有过的基因有3%出现在基因检测产品中,而非持有过的有5.4%。支持“专利阻碍创新”的文献非常少,作者这篇论文还提供了自然实验的证据。
重要事件发生的时间线如图:
读者肯定要问,是不是Celera测的基因没有HGP测的有用呢?作者当然排除了这个因素,具体请看背景和方法介绍。值得一提的是Celera并没有正式申请成功所有的基因的专利。基因作为生物的自然组成部分,权利权有很大的争议。在美英两国政府的压力下,Celera放弃了申请专利,所以他们只享有序列信息(“ACGTCCA…”)的IP,如果HGP测定了同一个基因的序列并公开,那么就没人去买Celera的授权了。Venter一开始设想的薅全人类羊毛商业模式并没有成功, 2002年被董事会赶出了Celera,Celera逐渐衰落,被并购,消失在公众视野中。
2.背景与数据
Celera为什么敢跟六国协作的HGP竞争呢?Craig Venter敢于率先使用糙而快的“鸟枪法“测序。传统的sanger法需要把DNA切割成1000bp左右长度的片段,一段一段按顺序测,精度高而速度慢。”鸟枪法“则是把DNA切割成100-150bp左右的片段,快速测定这些短序列,然后通过计算机比对重复序列拼接。HGP一开始对错误率较高的鸟枪法存疑,但是在Celera的竞争压力下,HGP也大量使用了鸟枪法,最终大部分基因都是鸟枪法测出来的。使用鸟枪法,哪个基因先测出来,哪个后测出来,有随机性。Celera基本只用鸟枪法,所以Celera测基因不作选择,但是HGP已经公布的基因,Celera不会声张。HGP有一部分已知重要基因会先挑出来测,后期基本用鸟枪法也不选择。
作者预计,因为HGP的选择性,Celera IP的基因平均不如非Celera IP的基因重要,如果做cross-section的估计,直接比较这两种基因的结果变量,应该会高估。如果比较Celera持有过的,2002年失效和2003年失效这两组基因的结果变量,那么是很好的自然实验,因为HGP后来也用鸟枪法,不会选择性的挑选基因,02年失效还是03年失效可以看作随机分配。如何比较基因在测序之前的重要性呢?可用1970-2000年之间相关论文数量来衡量,请看下图。
这幅图中显示了三组基因的平均测序前论文数量差。最下面那组(实线)显示Celera IP的基因平均论文数量低于非Celera IP的基因,如作者所料,HGP选择了一些重要的基因优先测序。中间(短划线)则局限于2001年测定的基因,这时候负值就比较小了,看得出来,HGP也在用鸟枪法冲刺测序,选择性大大减弱。最上面(点线)是2003年失效的Celera IP基因平均论文数减去2002年失效的Celera IP基因的平均论文数量,这条线基本在0左右,可见02年失效与03年失效这个分配的不是HGP的有意安排,自然实验成立。
结果变量(outcome)在哪里找呢?
作者用Online Mendelian Inheritance in Man (OMIM)数据库的两种记录作为科研产出变量:第一个是2001-2009的相关论文;第二是某个基因型(genotype)在2009年是否已经探明至少一个表型(phenotype),衡量基因的功能研究是否已经有进展。以RAX2基因为例,2001年被HGP公布,Celera不曾染指,2004年有论文建立了RAX2基因与老年视野中央部位的视觉衰退有关,则RAX2基因标记为“至2009年已记录表型”。产学研转化则看某基因是否有基因测试的产品面世,作者用GeneTests.org的记录。总的来看,到2009年,6%的基因已经进入测试市场。
3.结论
第一部分结论来自于cross-section回归分析,即比较Celera和非Celera基因的后续研究和产品开发,结果即前文 “Celera持有过的每个基因累积到2009年有1.2篇相关论文,而非持有的基因有2.1篇;持有过的基因有3%出现在基因检测产品中,而非持有过的有5.4%。“这个结果没有控制Celera持有和非持有基因本身的区别,作者承认是高估的。
第二部分结论来自于面板回归,回归方程略去。面板回归把基因看作多期连续观测对象,以Celera IP失效为感兴趣的因变量,控制基因固定效应,年固定效应,估计IP失效对论文发表和表型研究的影响。因为Celera IP基因中有检测产品面世的太少,这里无法估计对产研转化的影响。
这张图可以看出,IP失效后,科研产出逐渐上升。
第三部分结论来自于这篇论文中最严谨的自然实验,只看02年失效(N = 1047)与03年失效(N = 635)的Celera IP基因之间产出的区别。
上图显示,两类基因的论文发表开始有差别但是最终收拢,即产出的每年流量长期趋于一致。下图则显示,两类基因的知识存量却没有始终没有收拢,这点是很让人吃惊的,仅仅是1年的时间差导致的研发劣势,6-7年都补不回来。为什么有IP的基因研究产出少呢?
作者通过采访从业人员和引用文献解释如下:工业界和学术界的资源是有限的,工业界肯定优先从免费IP的基因开始开发,以免被Celera薅羊毛。学术界虽然可以免费获取IP,但是授权有很多限制,比如不能随意把数据给学生,更重要的原因还是学术界也希望成果转化,PI们今天发论文,明天可能就申请专利创业,如果从有IP的基因开始研究,最终难免被薅一把。
4.笔者的总结评点
这篇论文以独特的视角(人类基因组相关IP和产出),较有说服力的自然实验提供了“IP妨碍跟进创新“的证据。比之参考文献中类似话题在管理学顶刊AMJ的发表(Huan & Murray 2009),Heidi的自然实验部分要更严谨,体现了实证微观经济学的领先地位。这篇论文有深远的影响力,政策制定者在考量知识产权的授予范围和期限长短时,一定会参考这篇论文。
这篇论文是Heidi在哈佛的job market paper,毕业时在MIT经济系找到工作,2019年7月开始被斯坦福挖走。Heidi在创新领域继续深耕,最近又在AER发表了同一个话题的论文,探究基因专利的长期影响(笔者下一推文)。笔者非常推崇Heidi的工作风格,即对其他学科的进展嗅觉敏锐,勇于收集新数据,做原创研究,努力在一个领域深耕,发表多篇类似话题论文水平不下降;比之打一炮换一个地方,蹭流行话题,以最小的努力发尽量多的论文。
这篇论文是伟大的人类基因组计划的余波之一。Craig Venter几乎以一人之力,挑起基因测序的竞赛,让人类基因组计划得以提前完成,引发了各界对基因测序的投入和技术改良,推动了生物医药产业的进展,个人的名声虽毁誉参半,对全人类的福利的贡献是不可忽视的。搅活一潭水,Venter有鲇鱼之功。HGP测第一个人的基因组花费10亿美元,自此费用一路降低,2019年单人基因组全测序成本有望降低到500美元。如果从未来回溯历史,无疑我们正在经历一次产业革命。
这张图是Craig Venter的人生巅峰,2000年6月26日,克林顿与Venter(左一,代表Celera公司),Francis Collins (NIH主任,代表HGP)一同登台白宫新闻发布会,宣布人类基因组测序主要工作完成(竞赛平手)。Craig Venter在这场竞赛中名利双收,尽管最后因为商业模式失败,被公司扫地出门,还是拿走了一亿美元。Venter拿这笔钱开创了独立研究所,2010年宣告了首次人工合成染色体组装生物(支原体)的实现,又一次震惊世界。
Celera的商业模式依赖于基因专利的保护。基因作为自然产物,即使发现功能,申请专利还是有伦理争议的。90年代有若干公司零星取得了一些基因的专利,比如Myriad拥有乳腺癌相关BRCA1和BRCA2基因的专利,得以独享这两个基因的测试市场。大规模申请基因专利,会引发社会关注,能否成功还是未知数。投资人们在开创Celera时,应该已经考虑到大规模申请基因专利会有政府干预的风险,与其说是被Venter巧舌如簧所蒙蔽,不如说是超额利润让资本敢于冒险。2013年最高法院最终裁定Myriad的Brca1和Brca2基因专利无效,为这场法律和伦理争端划上句号。目前专利保护限于从mRNA反转录的cDNA,是人工制造的遗传信息载体但不是天然产物,法律与伦理都无争议。
Abstract
Do intellectual property (IP) rights on existing technologies hinder subsequent innovation? Using newly collected data on the sequencing of the human genome by the public Human Genome Project and the private firm Celera, this paper estimates the impact of Celera’s gene-level IP on subsequent innovation. Across a range of empirical specifications, I document evidence that Celera’s IP led to reductions in subsequent scientific research and product development on the order of 20–30 percent. These results suggest that Celera’s short-term IP had persistent negative effects on subsequent innovation relative to a counterfactual of Celera genes having always been in the public domain.
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。