财新传媒
位置:博客 > 香樟经济学术圈 > 空气污染会影响马拉松运动员比赛表现吗?

空气污染会影响马拉松运动员比赛表现吗?

推文人 | 息晨 
原文信息:Mengmeng Guo, Shihe Fu, 2019. ‘Running With a Mask? The Effect of Air Pollution on Marathon Runners’ Performance’, Journal of Sports Economics.
 
研究背景与介绍
 
现有的一些环境经济学研究考察了空气污染对短期劳动生产率的影响,如Zivin & Neidell(2012), Chang, Zivin, Gross and Neidell(2016)等。Fu, Viard and Zhang(2017)和李卫兵与张凯霞(2019)使用工企数据,分别研究了空气污染对企业人均产出、企业TFP的影响。但由于生产是多环节的过程,上述使用生产数据的研究很难剥离整个过程中其他环节的影响。本文分析空气污染对马拉松比赛运动员成绩的影响,避免了上述问题。此外由于比赛的注册都是开赛前几个月前完成的,比赛时出现空气污染组委会通常也不会取消比赛,为研究的因果识别提供了很好的条件。使用2014与2015年在中国进行的90场马拉松比赛的数据,实证分析表明空气污染对完赛时长的弹性为0.0408,表明恶劣空气显著降低了运动员的表现。
 
数据与实证模型设定
 
(1)研究数据
 
马拉松运动的比赛数据来自中国田径协会主管的www.runchina.org.cn 网站。本文样本为2014与2015年间在中国37个城市举办的56场赛事,由于部分比赛既包含半马也包含全马,一些比赛则只包含两者之一,样本共包含了90场比赛,其中半马47场全马43场。37个城市中,19个城市举办了1场赛事,17个城市举办了2场赛事,1个城市举办了3场赛事。上述网站记录了详细的参赛者个人层面的比赛数据,包括姓名、性别、所属年龄组、参加比赛名称、完赛时长等,共包含314341条记录。
 
空气质量数据来自环保部网站,包含AQI及细分污染物PM2.5,PM10,SO2,NO2,CO,O3的日平均及小时层面数据。每日的气象数据来自Bloomberg提供的全球气象数据库,文中用到的气象变量为降水、平均温度、平均风速与相对湿度。
 
(2)实证设定
 
基准模型设定如下:
被解释变量为i运动员t日在j城市参加比赛的完赛时长,W为气象状况向量,包括温度、风速、降水与湿度。X为参赛者个人特征向量,包括性别与所属年龄组,分别为18-34,35-39,40-44,45-59,55及以上。aj为城市固定效应。b1即为关心的比赛表现的空气质量弹性。
 
此外,模型中加入了比赛年份的虚拟变量(2014/2015),参加比赛是全马/半马的虚拟变量,以及双月的固定效应。在基准模型中,使用参加比赛当日的AQI作为空气质量的度量,并在后续使用比赛期间AQI均值作为稳健性检验。此外,将标准误聚类在赛事层面以允许同一赛事内选手表现的相关。
 
实证结果与讨论
 
(1)基准结果
 
在基准估计部分,将全样本作为混合截面数据进行估计,得到下表1的结果。第3列控制了气象变量与个人特征变量的结果表明,AQI增加1%运动员的完赛时长将增加0.0408%,此结果是稳健的且具有显著的经济意义。假定一位全马运动员在AQI为102的平均空气质量天气需要16581秒完成比赛,则按照模型的估计,在AQI为289的2014年北京马拉松比赛上,他的完赛时长将增加12分钟,对于马拉松比赛而言这将是不小的影响。此外,原文也较为详细的分析了气象、个人特征控制变量对比赛表现的影响,此处不列出。
 
 
(2)异质性分析
 
在此部分,作者将全样本分为全马比赛与半马比赛两部分,进行了较为丰富的异质性检验。表2是针对全马样本的异质性分析结果,表3为针对半马样本的异质性分析。
 
表2与表3的结果非常相似,但半马运动员受空气污染的影响较全马运动员更大,这可能是因为半马比赛全程较短,奔跑更为剧烈。男性、年轻运动员受空气污染影响更大,而且即使是各项赛事的Top运动员(前10、前20、前30)空气污染的负面影响仍是存在的,对于这些精英运动员,此种负面影响暗含着更为巨大的损失。
 
 
空气污染的非线性影响。通过将空气质量分组的设定,对空气质量的非线性影响进行检验。总体而言,空气污染对马拉松运动员的表现呈现出非线性性,随着AQI的增加影响更大。
 
分位数回归检验空气质量影响差异。10%与90%分位点的回归结果表明,全马比赛中,空气污染对前10%样本的影响更大(q10系数0.0341,q90系数0.0114)。而在半马比赛中,此关系是相反的(q10系数0.0302,q90系数0.0555)。
 
(3)潜在的内生性处理
 
若运动员个人特征与空气质量相关,如运动员倾向于进行特殊的训练以在恶劣空气下跑出好成绩,则遗漏个人特征将造成估计有偏。为缓解此问题,作者构建了运动员个人层面的面板数据进行FE估计。具体而言,首先删除在同一场比赛中姓名、性别、所属年龄组相同的个人,因为这些记录肯定不同属于一个人。其次,在不同的比赛中,根据姓名、性别、年龄、参加全马/半马构建个人层面面板数据。表4展示了面板数据的估计结果,标准误聚类在城市与个人层面。
 
1-4列估计结果表明,参加比赛不同次数子样本的弹性估计是非常相近的,但相较于基准结果的0.0408较低。此外,空气污染对男性与年轻运动员的影响更大。
 
 
此外更为重要的担心是在恶劣的空气下,运动员可能会选择退出比赛,即存在个人自选择问题。由于缺乏报名注册信息,无法与参加比赛运动员相比较,使用Heckman模型解决此问题。此处作者采用一个间接检验以说明潜在的自选择问题不会对估计造成很大影响。许多运动员从外地来参加比赛,假如他们根据比赛前的空气质量预测比赛当日的空气质量,那么比赛前空气质量较好会促使他们动身参加比赛,但比赛当日空气较差会使部分运动员退出比赛,这将造成严重的自选择问题。作者构建了比赛当日与比赛前AQI相差是否在15以内的虚拟变量 ‘similar’,并将其与AQI交乘加入基准模型中。从表5可见,AQI的估计系数与基准模型相近,交互项并不显著,意味着自选择问题或不严重。
 
 
(4)稳健性检验
 
使用比赛期间AQI均值替换比赛日平均AQI。由于样本中的赛事多是在上午7点至下午2:30举行的,使用当日早6点至下午3点的AQI均值替换日均AQI。估计结果显示除AQI系数相较基准结果较小外,显著性等与基准结果是非常相似的。
 
各种类型污染物对比赛表现的影响。将基准模型中的日均AQI替换为比赛时间内PM2.5、PM10、SO2、NO2、CO与O3六种污染物的均值,结果表明各种污染物对完赛时长均有负向影响,其中O3的影响在浓度高于70mg/m3才出现。
 
总 结
 
本文使用马拉松运动员比赛成绩的微观数据,识别了比赛时外生的空气污染对运动员表现的负面影响。使用体育比赛数据的优势是可避免生产过程中其他环节的影响,从而更为干净的识别空气污染的劳动生产率影响。但本文的一个不足是未将估计结果与相关文献进行横向比较,以验证本文结果的外部有效性。
 
Abstract
 
Using a sample of more than 0.3 million marathon runners of 56 race events in China in 2014 and 2015, we estimate the air pollution elasticity of finish time to be 0.041. Our causal identification comes from the exogeneity of air pollution on the race day because runners are required to register for a race a few months in advance and we control for confounding factors. Including individual fixed effects also provides consistent evidence. Our study contributes to the emerging literature on the effect of air pollution on short-run productivity, particularly on the performance of athletes engaging in outdoor sports.
 
 



推荐 0