财新传媒 财新传媒

阅读:0
听报道
推文人 | 何亚鸥 
原文信息:Julia Cagé, Nicolas Hervé, Marie-Luce Viaud, The Production of Information in an Online World, The Review of Economic Studies (Forthcoming)
 
研究背景和研究问题
 
新兴网络媒体的发展使得消费者获取信息愈加便捷。互联网对新闻报道的影响引发了学者对消费者获取新闻质量高低的关注。传统新闻报社往往承担着较高的固定成本来制作原创内容并从中获取收益,但是现代网络使得内容制作者借鉴他人成果变得更加容易。在对新产品知识产权保护较弱的情况下,原创内容提供商难以保护他们从原创内容中获取的收益。互联网时代,网络新闻制作和网络新闻消费变得越来越重要,而相关的微观层面研究却很少,据此JULIA CAGÉ、NICOLAS HERVÉ和MARIE-LUCE VIAUD三位学者研究了以下两个问题,第一,在有限的知识产权保护下,网络新闻产品的抄袭范围有多广?第二,网络新闻媒体生产原创内容的激励是什么?
 
数据
 
A、文本数据库简介和数据来源
 
本文文本数据库包含了2013年法国86家主要新闻媒体(包括1家通讯社,59家新闻报纸,10家网络媒体,9个电视频道,7个广播频道)在网络上发布的所有内容。数据库中包含了文本、照片和视频,本文主要分析文本部分。本文数据库包含了2,552,442份文件,平均每天约7000份文件,这些文件中70.9%来自于纸媒的网页版,4.5%来自于广播,6.4%来自于电视,15.1%来自法新社、路透社以及纯网络媒体。本文是第一篇使用超媒介方法(transmedia approach)研究信息生产的文章。
 
本文文本数据库来自于三处,第一,OTMedia研究项目的数据库(法国国家视听学院主导的研究项目中的部分内容),OTMedia研究项目使用RSS订阅追踪了2013年法国主要新闻媒体在网络上生产的内容;第二,对于OTMedia研究项目中缺乏的数据,作者抓取了新闻网站的网站地图进行完善;第三,从法新社和路透社获取了相关数据。
 
B、新闻事件识别
 
本文使用 “事件识别算法”(Event detection algorithm)对上述数据库的内容进行分类汇总,将属于同一新闻报道的文章的集合定义为一个新闻事件。本文使用算法从851864篇文章中识别出了25215个新闻事件。表1是新闻内容数据和新闻用户数据的描述性统计(新闻事件层面)。
C、新闻报道的时间线和原创率
 
根据新闻报道的发布时间,作者追踪了新闻事件中每则报道的时间线,确定第一个针对事件进行报道的媒体,并对其他媒体进行排名。然而并不是每篇新闻报道都是原创内容,作者通过抄袭识别算法(Plagiarism detection algorithm)识别出一篇新闻报道中与之前针对同一事件的新闻报道中的相同文字,进而确定该新闻报道的原创率(即文章中原创内容在全文中的占比)。
 
D、新闻消费者数据
 
作者收集了两套新闻消费者数据,分别为每日网上访客数据和社交媒体数据,从OJD(法国媒体组织)获取每日网上访客数据,其中包括唯一身份浏览量、访问数量和网页浏览量。社交媒体数据是指新闻报道在Facebook和Twitter上被用户分享的次数,作者用Facebook Graph API和Twitter Search API获取了相关数据。表2是新闻内容数据和新闻用户数据的描述性统计(媒体层面)。
 
 
新闻传播的速度、网络新闻文章的原创率
 
A、新闻传播的速度
 
新闻的商业价值在于新闻媒体对新闻报道独家使用权的时间,因此作者研究了新闻报道在不同媒体之间的传播速度。作者计算了关于同一事件的首篇报道和次篇报道之间的间隔时间(后文称反应时间)。表3为不同新闻媒介的反应时间,当新闻事件的首篇报道来自于通讯社,其他媒体的反应时间是最短的,平均反应时间是116分钟。
B、网络新闻文章的原创率
 
文中图2为样本中文章原创率的分布情况,该图为双峰分布,其中一个峰是原创率低于1%的文章占比(约为17%),另一个峰是原创率为100%的文章占比(约为22%),文章原创率的中位数为14%,文章原创率的平均数为36.5%。
文中图3为媒体的反应时间排序与媒体文章原创率之间的相关关系。平均而言,媒体报道反应越慢,媒体文章原创率也会越高。
理论分析
 
作者从理论视角分析,抄袭对新闻采编原创的激励取决于以下几个参数,消费者在不同媒体间的消费转换、抄袭的质量相对于原创的质量,消费者对原创的喜爱程度。作者用2013年数字新闻报道的调查数据研究消费者的新闻消费行为,发现消费者倾向于在不同的媒体中消费新闻信息,既具有移动性也具有忠诚性,大部分消费者会使用多个媒体(即有可能低质量媒体转向高质量媒体),同时也有部分消费者具有特定的意识型态,偏好于特定的媒体。
 
基于消费者会在不同新闻媒体间转换消费的前提,作者建立了分析抄袭对新闻媒体生产决策的理论模型(具体见文章附录)。模型中的三个主要参数为,消费者对原创的偏好,消费者对媒体的忠诚度,抄袭相对于原创的质量。模型中消费者在媒体忠诚度和对原创喜爱之间存在选择权衡,这个权衡取决于抄袭相对于原创的质量。当消费者对原创的喜爱与忠诚程度的比例远高于抄袭与原创的相对质量时,消费者会在不同的媒体之间转移消费,寻找原创程度高的内容,因此抄袭内容的高质量会显著降低原创内容的收益率。而往往抄袭内容的质量是远低于原创内容的质量,消费者对原创内容的爱好高于抄袭内容,从而抄袭的收益低于原创的收益,原创内容生产商有激励制作原创作品。
 
实证分析
 
为了估计网络媒体文章原创率的收益,作者选取了以下3个因变量,分别是文章在Facebook上被分享的次数,在Twitter上被分享的次数,以及预估的读者数量(数据库中缺少文章层面的每日读者数据,作者使用社交媒体分享数据进行估计,具体估计方法见原文),对因变量采取对数形式。
 
 
表5为回归结果。回归结果显示,文章的被分享数和阅读数都随着文章原创字符(或文章的原创率)的提高而增长。其中,一篇文章中每增加一千个原创字符,Facebook的转载率会增长22%,Twitter的转载率会增长11.4%,预估的读者数量会增长23.2%。文章的原创率增加50%(从0增加到50%),Facebook的转载率会增长40.5%,Twitter的转载率会增加17.3%,预估的读者数量会增长44.8%。结论表明读者更加倾向于消费原创内容,这给媒体生产原创内容提供了激励。根据文章的理论模型,实证结论表明样本数据中抄袭的质量相对于原创的质量较低,消费者对原创的喜爱程度更高(相对于媒体的忠诚度)。
 
作者还做了一些异质性检验并有以下发现:第一,媒体竞争环境越激烈,媒体文章原创的正向收益率越高。第二,媒体被竞争者抄袭的程度越高,媒体文章原创的正向收益率越低。第三,媒体文章原创的正向收益率会随着文章报道主题的差异而变化。
作者使用上式重新计算媒体原创内容占比数,其中original content指的是文章中的原创内容,non-original content文章中的非原创内容,number of views为文章的阅读量(包括每日访客量、Facebook转载量等)。根据原始数据(即没有加权)计算出的网络媒体文章原创率为32.5%,在经过不同方法计算出的阅读量对原创内容和非原创内容加权平均后,原创内容的消费占比在45.4%至61.4%之间,说明原创内容的消费占比大于原创内容的生产占比。作者在此基础上进一步讨论了原创内容收益被原创内容生产商占有的比例大小。
 
小结
 
作者使用2013年法国新闻的微观数据,研究了网络新闻内容的传播速度以及抄袭范围,同时研究发现消费者倾向于消费原创新闻,作者认为这在一定程度上缓解了抄袭引起的新闻采编激励问题。是否对网络新闻媒体实施更加严格的版权法仍是一个开放的问题,也许需要一个新的政策工具来解决新闻媒体的盈利困境。当然在处理这些问题时,应当将消费者对新闻媒体采编策略的反应以及他们对新闻原创质量的偏好纳入考量。
 
Abstract
 
News production requires investment, and competitors’ ability to appropriate a story may reduce a media’s incentives to provide original content. Yet, there is little legal protection of intellectual property rights in online news production, which raises the issue of the extent of copying online and the incentives to provide original content. In this article, we build a unique dataset combining all the online content produced by French news media during the year 2013 with new micro audience data. We develop a topic detection algorithm that identifies each news event, trace the timeline of each story, and study news propagation. We provide new evidence on online news production. First, we document high reactivity of online media: one quarter of the news stories are reproduced online in under 4 min. We show that this is accompanied by substantial copying, both at the extensive and at the intensive margins, which may constitute a severe threat to the commercial viability of the news media. Next, we estimate the returns to originality in online news production. Using article-level variations and media-level daily audience combined with article-level social media statistics, we find that original content producers tend to receive more viewers, thereby mitigating the newsgathering incentive problem raised by copying.
话题:



0

推荐

香樟经济学术圈

香樟经济学术圈

1539篇文章 1天前更新

香樟经济学术圈由中国社科院、哈佛大学、多伦多大学等国内外青年经济学者发起。此平台主要推送国外经济学领域经典前沿论文,发布国内外经济学相关资讯,以及香樟经济学者圈的相关活动公告。 期待能够对中国经济学研究和国家政策产生一定影响。微信订阅号:camphor2014。

文章