阅读:0
听报道
推文人 | 赵广川
原文信息:Zhang, Yi, Martin Salm, and Arthur Van Soest. 2018. “The Effect of Retirement on Healthcare Utilization: Evidence from China.” Journal of Health Economics, 62:165–77.
背景及问题提出
老龄化是中国社会现在和未来一段时间面临的重大挑战。国家统计局数据显示,我国65岁以上老年人口已经从2005年的1亿增长到2015年的1.43亿。然而,在人口快速老龄化的同时,我国法定退休年龄却是全世界最低的:男性为60岁,女性为50或55岁。退休人员规模的不断增加给全社会带来了沉重的负担。因此,越来越多的人开始讨论延迟退休,即提高法定退休年龄。
为了细致了解退休政策带来的全部影响,作者试图从医疗保健的角度讨论退休对医疗服务用的影响。讨论这一问题的另外一个原因在于:无论从经济理论还是已有的实证研究来看,退休对医疗服务利用的影响尚未明确。一方面,退休会降低了人们使用医疗保健的时间成本,对健康产生负面影响(如降低认知能力、增加肥胖),进而会增加人们的医疗服务利用;另一方面,退休也有可能会减少人们的医疗服务利用,其原因在于退休后收入水平的下降、生活方式的改变等。因此,在中国,退休是如何影响医疗服务利用的?是正向还是负向的?其具体的因果效应是多少?这些成为这篇文章所要回答的主要问题。
数据来源与变量说明
文中使用的数据来自于CHARLS在2011年和2013年的调查。由于我国的退休制度主要是针对城市工人,不包括农民。因此,作者将样本限定为40至75岁的城市居民。这使得样本规模从36338减少到7289。另一方面,作者剔除了个体经营人员(没有办理退休)和既不工作也没报告“办理退休”的个体。样本进一步减少到5438。最后,作者还剔除了退休状态、年龄和性别有缺失值的样本,最终得到5178个样本。
关于退休的界定。通常来说,退休有三种定义方式:(1)自报“办理退休(processed retirement)”。但这不是理想的定义,因为很多人即使从之前的工作上退休,但仍然工作(占总样本的20%)。(2)既没有有偿工作,也没有寻找有偿工作。这也不是理想的定义,因为有一部分人从始至终都没有有偿工作,也没有从工作上退休。(3)结合(1)和(2),将退休定义为自报已办理退休,同时也没有有偿工作。本文认为退休是从工作状态到非工作状态的转变,因此,选择第三种定义作为文章分析的基础。但是,作为对比,作者也汇报了不同退休定义下的结果(原文表8和稳健性检验部分)。限于篇幅,其他变量的界定和统计学描述见原文。
分析策略
由于文章的目的是估计退休对医疗服务利用的影响效应,相应的基准模型如下:
文中选择了12个因变量,即Hit包括是否看过门诊,看医生次数、门诊费用、是否住过院、住院时长、住院费用、是否自我治疗、自我治疗费用、是否做过健康检查、是否有过应看门诊而没有看门诊、是否有过应住院而没有住院、自评健康。Rit 是表示退休的二元哑变量,因此, τ就是退休对因变量影响的因果效应。Xit 是前定变量,包括年龄、年龄的平方、年龄的三次项、是否与配偶住在一起、受教育类型和常数项。
如果假定εit是与Rit和Xit不相关的特异冲击,那么,OLS估计就能得到 τ的一致估计量。然而,事实上,这一假定是不符合现实的,因为退休常常是内生的。举例来说,退休与医疗服务利用可能同时受到不可观测的健康因素或其他因素的影响。
已有的文献,在处理退休的内生性时,通常采用工具变量法和模糊断点回归设计。在这篇文章中,作者选择非参数模糊断点回归设计(nonparametric fuzzy RD),相较于参数形式的模糊断点回归,非参数模糊断点回归设计可以避免函数形式的限制性假设。当然,为了稳健性检验,作者还进行线性工具变量回归(linear IV regressions)。
在RD框架下,退休对因变量影响的因果效应 τ为:
H表示因变量,R表示退休变量,与公式(1)一致;a表示实际年龄减去法定退休年龄:对于男性来说,a=age-60;对于女性来说,a=age-50。关于年龄的处理,需要加以说明。在我国,法定退休年龄是男性60岁,女干部55岁,女工人50岁,对于一些特殊工作,可以允许提前退休。但是,在图1中,可以发现女性在55岁前后的退休率并没有发生明显的跳跃,因此,不能作为断点处理。其原因是,女干部在所选样本中相对来说只占了较小的一部分。
一项有效的模糊断点回归设计,必须首先满足两个假设(适用性检验):其一,退休概率在断点处不连续,即 ;其二,其他前定变量在断点处必须连续。将图1投射到图2,可以作为第一个假设的检验,可以发现断点处,退休概率提高了大约30%。第二个假设的检验,作者放在了第七部分。其他一系列检验也会在第七部分提到。
此外,需要补充说明的是,在非参数模糊断点回归中,作者借鉴了Lee and Lemieux(2010)提出的“residualize”方法,即将因变量残差化,以降低方差。具体过程是,先用因变量对年龄多项式(年龄、年龄平方、年龄三次项)和其他控制变量回归,得到残差项,然后在此残差的基础上利用非参数RD。关于带宽的选择,作者选择了Calonico et al. (2014, 2016)提出的数据驱动的方法。其结果是基于两个独立的MSE-optimal带宽(具体见附表A. 3)。
实证结果
文章的主要实证结果见表4。表中“Conventional”是指利用常规的系数和方差估计,“Robust”是指利用偏差修正系数估计和稳健方差估计(后者是为了修正有限样本情况下局部线性回归中潜在误设导致 的偏误),相应的结果分别对应于表4中列(2)和(3)。根据表4,作者由此得出结论:两种方法估计的结果非常接近(比较疑惑的是,蓝色方框中,门诊支出在“conventional”中估计系数只有0.289,与“robust”中的系数相差太大,与标准差也不一致???)。总的来看,RD估计结果表明退休对医疗服务利用的影响几乎全部为正,且其结果与OLS相比,相应变量的系数均更大,但显著性有所降低。从最稳健的结果来看,无论男性还是女性,退休对他们看医生次数均有显著地正向影响。具体来看,男性退休之后看医生的次数每个月平均要增加1次,而女性退休后看医生的次数每个月平均增加不到1次。由于看医生次数的平均值只有0.43,因此,这一影响还是很大的。此外,退休对住院时长和自我治疗的自负费用也具有显著的正向影响。具体来看,退休提高了0.4个(0.6个标准差)住院时长,增加了自我治疗中约177元的自负费用,约为8%的年收入。其他变量的结果见表4和原文。
影响机制
文章进一步对退休影响医疗服务利用的作用机制进行了检验,主要包括以下三个渠道:健康、时间和收入。
从健康渠道来看,已有的研究关于退休对健康的影响尚未达成一致。一方面,退休可能对健康产生负向影响,这是因为部分退休人员退休后的身体活动会更少,其退休前的身份、社会联系以及自尊等随着退休而消失;另一方面,退休对健康的影响也可能是正向的,这是因为退休后可以有更多的时间用于健康促进活动,或者从之前艰苦、危险的工作中解脱出来。作者通过选择几个健康相关指标对此进行了验证,具体包括自评健康、BMI、血压、精神健康、生活满意度、吸烟、慢性病等(具体见表5和附录C)。相关结果见表5,但是需要注意的是,关于退休对健康的影响的解释需要非常小心。(1)当我们发现退休对高血压和BMI的正向影响时,不能直接认为这会直接转化为医疗支出;(2)退休对自报慢性疾病数的影响,可能是因为退休后慢性疾病被诊断出来了,其实在退休前就已经患有慢性病,因此,这一影响可能并不是退休本身对慢性病的作用。
从时间渠道来看,退休之后花费在医疗保健上的时间的机会成本下降了,这变相激励人们使用更多的医疗服务。这是因为退休前作为雇员,请病假可能意味着收入的损失,甚至有失去工作的风险。在私人部门和临时雇佣关系中,请病假的机会成本会更高。因此,在私人部门的员工有更强的动机推迟医疗保健,特别是花费更长时间的住院治疗。反而在退休之后,不用担心收入和工作损失,他们可以花费更多的时间排队等候可用的病房并住院。也就是说,在私人企业或临时雇佣中工作的员工其请病假的机会成本比在政府部门、公共机构和国有企业工作的员工更高。根据这一逻辑,作者给出了间接验证时间渠道的方法。即如果时间渠道有作用,那么,从私人部门退休的员工其退休对住院时长和住院费用的影响平均要高于公共部门员工退休的影响。因此,作者构建了公共部门和私人部门两个子样本,并进行回归和比较,具体结果见表6。
从收入渠道来看,在医疗保险共付比例较高的背景下,如果退休后收入下降,这有可能对医疗服务利用产生负向影响。然而,在表5中,没有发现退休后的收入显著性下降。事实上,退休后,人们使用了更多而不是更少的医疗服务。这意味着收入不是退休影响医疗服务利用的主要渠道。然而,收入对社会经济地位较低的人确实很重要,因为有限的收入对他们有约束力。因为收入与教育的相关关系,作者根据受教育程度进行分组,进一步分析了不同组间退休对医疗服务利用的影响(表6)。
此外,作者还通过健康投资行为和预防保健进一步分析了退休对医疗服务利用的长期影响。
敏感性分析和模型设定检验
2.固定效应IV估计
除了上述回归方法,作者还采用了固定效应IV估计(fixed effects instrumental variables estimation),相关结果见表A. 15的第(1)和(2)列。此外,作者又增加了IV进行回归(该IV为二元哑变量:是否大于提前退休年龄;即男性55岁,女性45岁),该方法得到的结果与表4的结果大致相同。同时,该方法可以通过过度识别约束检验工具变量的联合有效性,结果见附表A. 15。
3.样本损耗问题
样本损耗主要考虑这一情形:由于在第一期调查中出现的部分样本在第二期可能就不在了。样本损耗可能会对上文的主要回归结果产生影响。因此,作者采取了两种调整样本的方式进行稳健性检验:(1)剔除只在第一期出现的样本,即仅保留两期同时出现或仅在第二期出现的样本;(2)使用平衡样本,即必须两期均出现的样本。相应的回归结果与表4的主要结果基本一致,具体见表7的(5)到(8)列。
4.退休的另外两种定义
由于对退休定义的不同,实证结果可能出现较大差异。因此,作者借鉴Coe and Zamarro(2015a)d的定义(退休是指不在进行有偿工作,与变量说明中的第二种定义类似)重新进行回归,以验证上述结果对退休定义的敏感性。结果发现,在断点处,退休概率仍然有明显跳跃,在新的定义下,退休的影响比表4中的结果还要大。这可能是新样本中包含了受教育水平相对更低的样本,这部分人中退休对医疗服务利用的影响更大。此外,根据前文中第一种定义,作者也进行了相应的验证,结果与表4基本相似。具体见原文表8。
5.其他模型设定检验
(1)RD方法的非常关键的一个前提是其他变量在断点处连续。文中验证的变量包括养老保险参保率、医疗保险参保率、不同医疗保险间转移的次数等(A.8和B.6)。除此之外,作者还验证了达到法定退休年龄但没有退休的个体,其收入、工作小时数、医疗服务利用在法定退休年龄处也没有跳跃(A.9)。(2)作者还进行了安慰剂检验,即假定断点在-1,+1,-5,+5处,是否还存在退休的影响效应(表8)。(3)作者以农村居民样本为例进行了证伪检验。显然,因为农村没有法定退休年龄约束,因此,在所谓的“法定退休年龄”处,退休概率和其他因变量没有断点(图B.8和B. 9)。(4)作者调整了不同的带宽(假定断点上下的带宽相同)重复上述主要过程,发现回归结果对带宽的选择比较稳健(表A.10)。
写在后面
这篇文章对退休对医疗服务利用的影响做了细致的分析和讨论,内容十分丰富。虽然文中主要的回归结果是基于非参数模糊断点回归设计,但是,事实上,作者选择了很多中因果识别的方法和其他技术手段确保因果识别的稳健性。Appendix中提供更为完整的实证分析结果,感兴趣的读者可以对照正文学习。
推文作者:赵广川,南京财经大学公共管理学院,研究方向:健康经济与政策。
Abstract
We examine the effect of retirement on healthcare utilization in China using longitudinal data. We use a nonparametric fuzzy regression discontinuity design, exploiting the statutory retirement age in urban China as a source of exogenous variation in retirement. In contrast to previous results for developed countries, we find that in China retirement increases healthcare utilization. This increase can be attributed to deteriorating health and in particular to the reduced opportunity cost of time after retirement. For the sample as a whole, income is not a dominating mechanism. People with low education, however, are more likely to forego recommended inpatient care after retirement.
话题:
0
推荐
财新博客版权声明:财新博客所发布文章及图片之版权属博主本人及/或相关权利人所有,未经博主及/或相关权利人单独授权,任何网站、平面媒体不得予以转载。财新网对相关媒体的网站信息内容转载授权并不包括财新博客的文章及图片。博客文章均为作者个人观点,不代表财新网的立场和观点。