财新传媒
位置:博客 > 香樟经济学术圈 > 文章标题越长,质量越差?

文章标题越长,质量越差?

 

推文人 | 李江艳
推文信息:Bramoulle, Y., & Ductor, L. (2018). Title length. Journal of Economic Behavior and Organization, 150, 311-324.
 
研究背景
 
在这篇论文中,作者研究了一个比较新颖且有趣的问题:经济学学术论文标题的长度与该论文质量之间是否存在一定的联系。关于提出该研究问题的原因,作者给出了如下解释。首先,论文标题的长度和论文质量之间可能存在着因果关系。例如,含有较短标题的论文可能更容易被人们记住,从而间接增加该文的引用率。其次,可能存在一些因素能够同时影响论文标题的长度与论文质量。例如,一篇学术论文作者的研究能力及学术写作能力可能会同时对论文研究结果及论文标题长度产生影响,即好的研究者可能通常会采用稍短一些的标题并且能够在好的期刊上发表一些引用率较高的论文。同时,作者还给出了一些经济学领域内开创性研究论文使用较短标题作为例子。例如,Cobb 和Douglas (1928) 提出科布道格拉斯生产函数的著名论文“A Theory of Production”(仅22个字符)。又如,Kuznets (1955)的开创性论文“Economic Growth and Income Inequality”(仅37个字符)。而在这些开创性研究之后所出现的论文则需要采用一些更长的标题。基于以上,这篇论文的作者试图在控制期刊质量、论文页数、JEL分类及作者相关特征等因素的情况下研究经济学学术论文标题长度与论文质量间的关系。
 
数据选取
 
这篇文章的数据主要选取自EconLit数据库 (即由美国经济学会(American Economic Association)创立的经济学领域的引文及文献数据库)。作者选取了EconLit数据库中收录的发表于1970年至2011年期间的所有论文。其中,所有论文标题中含有“note”, “comment”, “preface”, “remark”, “reply” 及 “foreword”等词的论文被排除 (仅占总样本的1.1%)。据此,本文作者收集到了发表于1617个学术期刊上的580,055篇论文。
 
本文作者将从三个方面来衡量一篇论文的质量 (article quality),即发表该论文的期刊的质量 (journal quality),该论文的引用量 (citations),该论文的新颖度 (novelty)。其中,关于期刊质量的衡量,作者采用了Kodrzycki 和 Yu (2006) 及 Ductor 等 (2014) 所引入的对期刊影响因子标准化的衡量办法 (详见原文)。关于论文引用量的衡量,作者使用了从Web of Science 数据库中所获得的引用量数据。关于论文新颖度的衡量,作者则使用了 Boudreau 等(2016) 及 Sreenivasan (2013) 所建立的一个基于论文关键词组合非典型性指数 (详见原文)。通常论文的关键词即代表论文所研究的核心领域。而该指数则衡量了一篇论文关键词与以往研究相比出现的相对低频性。最后,关于一篇论文标题长度的衡量,作者则是直接计算标题中字符 (包含空格及标点) 的个数。
 
描述性统计
 
(1) 论文标题长度与期刊质量 (原文图1)
由上图 (原文图1) 中,我们可以看出在较高质量期刊中发表的论文相对来说含有更短的标题。
 
(2) 论文标题长度与引用量 (原文图2)
同样地,在上图 (原文图2) 中,我们可以看出引用量较高的论文其标题相对来说更短。
 
(3) 论文标题长度与新颖度 (原文图3)
在上图 (原文图3) 中,我们能发现与原文图1及原文图2 中所发现的类似趋势,即新颖程度较高的论文,其标题相对来说更短。
 
(4) 随时间及期刊质量变化的论文标题长度
上图 (原文图4) 中显示了各类不同等级期刊中论文标题长度随时间变化的趋势。在上图中,我们能很明显的看出 ,在1974年至2011年期间,在B 类及以下等级的期刊中所发表的论文的标题长度呈明显上升趋势。根据原文作者的观点,这种标题逐渐变长的趋势可能是因为在上图中所统计的时段,有大量论文出现并发表,而这类论文更多是对一些开创性研究所进行的更为精细且更为专业化的探索。因此,这些论文的作者可能需要使用更长的标题从而更好地描述他们的研究。
 
同时,我们也可以看到一个有些许差异的趋势出现在A 类及以上等级的期刊中,即在A类及以上等级的期刊中所发表的论文的标题长度在1980年以前呈现出上升趋势,随后则开始呈现出逐渐下降趋势。作者认为,关于这种趋势的一个可能原因为在上图 (即原文图4)中所统计时间段内所出现的不断增加的竞争,而这种激烈的竞争导致在顶级期刊发表论文的机会变得越来越稀缺。因此,论文作者们不断地增加其文章的质量以期能够获得在顶级期刊发表的机会,从而导致其文章标题变得更短。
 
计量模型
 
根据上述描述性统计结果,本文作者建立以下三个计量模型,分别从期刊质量、论文引用量及论文新颖度等三个方面来研究论文标题长度与论文质量间的关系。
 
模型 (1): 期刊质量与论文标题长度
其中被解释变量 log(qi) 为发表论文i 的期刊的影响因子的对数值,解释变量 (independent variable) 包括论文标题长度 length,论文页数 pages,论文所属的JEL分类号,研究团队的专业化程度 Hr,t-1 (表示为研究团队r 在t-1年及之前的论文发表数量),研究团队的过去产出 Tr,t-1 (表示为研究团队r 在t-1年及之前的论文发表数量,并以期刊质量作为权重),以及研究团队中不同作者的过去产出 Ar,t-1; 除此之外,作者还将研究团队哑变量δr, 发表年份哑变量μt等加进了该计量模型。
 
模型 (2): 论文引用量与论文标题长度
其中被解释变量 log(ci+1) 为论文i 的引用量加1后的对数值,解释变量 (independent variable) 包括论文标题长度 length,论文页数 pages,论文所属的JEL分类号,研究团队的专业化程度 Hr,t-1 (表示为研究团队r 在t-1年及之前的论文发表数量),研究团队的过去产出 Tr,t-1 (表示为研究团队r 在t-1年及之前的论文发表数量,并以期刊质量作为权重),以及研究团队中不同作者的过去产出 Ar,t-1 ; 除此之外,作者还将研究团队哑变量δr, 发表年份哑变量μt,以及期刊固定效应因素vj等加进了该计量模型。与模型 (2) 类似的计量模型也被用来检验论文新颖度与论文标题间的关系。
 
研究结果
 
(1) 论文标题长度与期刊质量 (原文表1)
与描述性统计中 (原文图1) 所显示结果一致,根据上表 (原文表1) 中的回归结果,我们可以看出论文标题长度对发表该论文的期刊的质量有显著解释作用,且标题更短的论文往往能够发表在质量更好的期刊上 (此文中具体为影响因子较高的期刊)。同时,我们能看出,此结果在控制了论文页数、论文作者数量、作者所属研究团队的专业化程度、作者所属研究团队的产出及论文新颖度等因素的情况下依旧成立。
 
(2) 论文标题长度与引用量 (原文表2)
同样地,与前文描述性统计 (原文图2) 所示结果一致,根据上表 (原文表2)中的回归结果,我们可以看出论文标题长度对论文引用量也有着显著的解释作用,且含有较短标题的论文往往具有更高的引用量。类似地,该结果在控制了论文页数、论文作者数量、作者所属研究团队的专业化程度、作者所属研究团队的产出及论文新颖度等因素的情况下依旧成立。
 
除此之外,原文中作者还分别对不同等级的期刊中,论文标题长度与引用量之间的关系进行了研究 (原文表3),回归结果发现上表(原文表2)中关于论文标题长度与论文引用量之间的显著的负相关关系依然成立。
 
(3) 论文标题长度与新颖度 (原文表4)
与前文描述性统计结果 (原文图3) 所示一致,根据上表 (原文表4) 中的回归结果,我们发现论文标题长度对论文的新颖度有显著解释作用,且标题越短的论文的新颖度往往会越高。同样地,该结果在控制了论文页数、论文作者数量、作者所属研究团队的专业化程度、作者所属研究团队的产出等因素的情况下依旧成立。
 
研究结论
 
通过对EconLit 数据库中1970年至2011年间所发表论文的分析,本文作者发现一篇论文标题的长度与该论文的质量之间存在显著的负相关关系。为使该研究结果更为稳健,本文作者从以下三个方面来衡量一篇学术论文的质量: 即该论文所被发表在的期刊的影响因子、该论文的引用量及该论文的新颖度。作者发现,论文标题长度与论文质量之间呈负相关关系这一结果在这三个方面均成立,且在控制了重要决定性变量,例如发表年份、研究方向在整个经济学领域所占比例、期刊、研究团队专业化及研究团队总产出等,的情况下依然成立。
 
文章原题为:文章标题长度和文章质量之间有联系吗?
 
Abstract
 
We document strong and robust negative correlations between the length of the title of an economics article and different measures of scientific quality. Analyzing all articles published between 1970 and 2011 and referenced in EconLit, we find that articles with shorter titles tend to be published in better journals, to be more cited and to be more innovative. These correlations hold controlling for unobserved time-invariant and observed time- varying characteristics of teams of authors.



推荐 0