原文信息:
Heblich S, Trew A, Zylberberg Y. East-side story: Historical pollution and persistent neighborhood sorting[J]. Journal of Political Economy, 2021, 129(5): 1508-1552.
01
研究概览和研究背景
英国有一部长寿的肥皂剧叫《东区人》(EastEnders),背景就是伦敦东区的劳工阶级社区。这不是偶然的文化选择:在很多曾经的工业城市里,东侧确实比西侧更穷、环境更差。伦敦、巴黎、曼彻斯特,这个格局在很多城市都能看到。本文的核心主张是:这背后的系统性经济原因是工业革命时期的煤烟污染。最有趣的问题在于:煤炭时代早就结束了,英国的清洁空气法案在1956年早已通过,为什么150年前的污染格局,到今天依然能看到它留下的社会痕迹?文章正是要回答这个问题。

左图(Panel A)展示了英国历史上的煤炭消耗量,可以清楚地看到从19世纪中期开始急剧攀升,在20世纪初达到顶峰。右图(Panel B)显示英国城市人口增长率,工业化高峰期人口持续增长。两张图结合起来,描绘了工业革命带来的煤炭消耗和城市人口集聚,这正是大量烟囱出现、污染急剧加重的宏观历史背景。
为什么这个问题重要?因为社区区隔有很大的福利后果。它影响到人们获得学校、工作和公共服务的机会,影响到同伴效应和社会流动性,它也影响到房产价值和财富积累。
理解持续性的机制对政策制定至关重要:如果分选是由基本面驱动的,那我们应该改善当地的公共设施;如果分选是自我强化的,那就需要协调机制或补贴;社会住房政策也可能发挥作用。这篇文章的贡献就在于量化历史因素和社会互动在维持隔离中各自扮演的角色。
研究的首要贡献有三点:第一,探讨工业煤炭污染对城市空间组织的长期影响。文章通过对比Lee和Lin关于自然景观的研究,首次证明了暂时的环境恶化(如燃煤污染)如何导致社区分选的持久性改变。其次,文章将研究与绅士化和隔离动力学文献联系起来。结合Hanlon及Brueckner等人的理论,发现了一个非线性效应:高污染地区即使在环境改善后,依然会长期排斥高收入居民,导致空间结构的固化。第三项贡献是方法论上的创新:文章开发了一种地理定位算法,能够精确匹配1881年的人口普查记录,并数字化了大量历史地图。这为研究城市演变提供了全新的数据集,拓展了相关历史制图的研究路径。
02
数据
本文的数据构建工作量是非常大的。污染测量方面,作者从19世纪末的Ordnance Survey(OS)地图上识别和定位了5000多个工业烟囱。OS地图相当于现在的Open Street Map,标注了极其详细的建筑轮廓和用途。接着使用 ADMS 5 大气扩散模型,结合风向地形,重建出每个LSOA(约1500人的底层普查单元)的历史污染暴露。在居住分层方面,作者用1881年普查的2600万条记录,将个体聚类定位到对应的LSOA。时间跨度从1817年到1881年,再到当代2011年。
其中,排放量的计算如下:

这个公式的经济直觉是:既然作者没有每个烟囱确切的煤耗记录,就采用了行业平均值来分配。某个烟囱i的排放率Ei,等于它所属的行业k在城市c的总煤炭消耗量,除以该行业在该城市的烟囱总数。分子来自历史行业统计资料,分母是作者从OS地图上数出来的烟囱数量。这个排放量会作为ADMS 5模型的输入,结合风向和地形,算出每个LSOA受到的污染暴露量。
数据构建的第一步是从OS地图上找出所有工业烟囱,作者开发了图像识别算法。算法的基本思路是:先对扫描的地图做图像预处理(灰度化、二值化),然后用模板匹配的方法找到符号,再结合周围是否有工业建筑轮廓等上下文信息过滤掉误识别,最后提取精确坐标。

这张图展示了识别算法的工作流程。从原始地图扫描,到最终标注出识别到的烟囱位置(图中的编号,如X00006)。可以看到,在工业设施区烟囱被精准识别,而住宅区则被合理忽略,这与真实历史情况高度一致。
有了烟囱的位置和排放量估计,下一步是转化出污染暴露。这里用的是专业级的ADMS 5大气扩散模型。它的原理是利用已知的大气物理学方程,包括风速、风向、大气湍流、地形起伏来模拟污染物如何扩散。输入端是烟囱的物理参数和气象数据;输出端是地理坐标点的SO2浓度。作者还专门调整了模型参数,以反映当时工业烟囱高度较低、出口温度较低的历史特征。
有了污染数据,还需要计算1881年各LSOA的职业构成。1881年普查有近2600万条记录,但地址是未数字化的纯文本。作者采用了两步走战略:第一步,模糊匹配。把普查地址与历史遗址地理编码库做匹配,约有20%的家庭实现了精准的地理定位。第二步,聚类算法。对于未精确定位的家庭,依据人口普查员走访的顺序,根据已知邻居的位置进行空间推断和分配。最终,约500万名工人被准确定位到了5538个LSOA。

数据完毕后,作者在图6将70个城市中心对齐取平均,展示污染和贫穷在空间尺度上的梯度分布上方的Panel A是平均污染浓度图,Panel 是平均低技能工人比例图。可以极其清晰地看到:无论污染还是贫困,都在市中心的东侧达到最高峰,两张热力图在空间上呈现了完美的东侧吻合。
03
实证回归(1881年)
进入核心实证部分。这部分的重点是确认历史污染和1881年邻里职业构成之间的因果关系。最大的内生性挑战在于:烟囱的选址可能并非随机。为了解决这个问题,作者采用了城市固定效应、天然水道工具变量(IV),以及绝妙的旋转风向安慰剂检验。
3.1基准回归

看这里的回归方程设定(请注意这是截面上的回归)。是LSOA在1881年的低技能工人比例(这里,加下标目的是和后文第二段实证回归保持一致);是推算的历史污染暴露(标准化对数)。控制了海拔、市中心距离等地理特征。特别需要注意的是:这是1815年区级的地产税,它控制了工业化前该地区原有的富裕程度。加入这个历史禀赋后,核心系数捕捉的就是纯粹由污染带来的影响。

这是OLS主回归结果Table 2。加入全控制后从0.044降到了0.034,但依然高度显著。这说明污染确实解释了低技能工人比例中相当一部分的方差(标准化效应约 0.13),并且大部分效应并不是由遗漏变量驱动的。证明了在1881年,污染越重的LSOA,低技能工人越多。
3.2工具变量回归
工业革命早期,蒸汽机需要大量冷却水,所以工厂几乎必须建在水边。 1827年的内河水道是工业化之前就存在的交通和水源网络, 它的布局是历史地理条件决定的,与后来的邻里社会结构没有直接因果关系。 因此,以水道位置为起点来预测烟囱位置,产生的预测污染就是外生的。
工具变量的设计非常巧妙。文章不是把河道直接当工具变量,而是把风吹过的河道烟尘当工具变量。在这些河道线上,每隔100米假设放一个工业烟囱,经过风的吹散,变成了一片覆盖全城的污染热力图。即使一个 LSOA 距离河道2公里或者更远,只要它在河道的正东边(顺风向),它的工具变量的预测污染值就会很高。如果它在河道的西边(逆风向),即使距离只有500米,它的工具变量值也会较低。为了排除掉靠近水道可能有的效应(水道是当时最重要的货运通道,河边可能极其嘈杂、拥挤),工具变量样本中去掉距实际水道较近的LSOA。

对比左下角基于实际烟囱产生的真实污染图,两者在空间形态上高度相似。说明水道预测的污染与实际污染高度相关(第一阶段强),且外生排除了人为选址带来的偏误。

这是1881年的IV回归结果。表3中IV估计的系数不仅显著,甚至比OLS结果还要略大一些。IV和OLS的高度一致性说明:内生性偏差在本文不是致命问题,污染确实因果性地导致了19世纪城市空间上的贫富隔离。
3.3与工业化前的效应对比

这张散点图展示了两个年代的情况。实心黑点和实线是1881年的数据,污染与低技能工人比例有显著且稳健的正向线性相关。而下方的虚线和三角形是1817年(工业化之前的时代)的数据。当时的相关性几乎是一条水平的零线。
3.4旋转风向安慰剂检验
旋转风向安慰剂检验的逻辑是:既然结论是风把污染吹出来的,那我如果在模型里强行把实际风向旋转30度、60度直到180度生成虚假污染,然后去跑回归。如果效应真的来自真实的污染扩散,那这些假污染就不该与现实中的贫困有任何关联。这彻底驳斥了只要靠近工厂就穷(不管什么风向)的替代假说。

右上角的 1881 年图(Panel B),横轴是旋转的角度,纵轴是回归系数。只有在0度(也就是现实中的真实风向)和极小偏差范围内,系数显著为正;只要角度偏离超过90度,系数就趋近于零甚至变负。同时左上角的1817年在任何角度全都是一条平线,完美印证了风向扩散的因果机制。
文章还做了大量的稳健性检验。包括烟囱高度设定、邻近烟囱密度、住宅污染干扰、各类固定效应及空间误差聚类等。所有的检验都指向同一个结论:估计值非常稳定。
04
实证回归(1971-2011年)
我们把时间推进到现代。1956 年《清洁空气法》通过后,空气污染很快大幅消退。令人惊讶的是:到2011年,历史上的这波污染依然对当前的邻里构成有20%的解释力!这说明,当前的贫富格局已经不是由当下的空气质量决定的了,而是陷入了某种长期的路径依赖。
4.1 OLS回归
和基准回归的回归式相同,但是污染仍旧定在1881年的污染水平,进行OLS回归。

在每个截面上,历史污染的系数不仅显著,其标准化系数甚至比1881年时还要大。这在经济学上意味着,没有出现所谓的均值回归(Reversion to the mean),历史造成的隔离异常牢固。这个表格证明了即便物理上的阴霾早已散去,当年高污染的社区今天依然是低技能人群的聚居地。系统在几十年的去工业化进程中,依然维持着曾经的阶层裂痕。
4.2 工具变量回归

在长达40年的时间跨度中,工具变量估计的系数持续高度显著,而且略大于OLS结果。这证明这种当代的空间贫困依然是当年那场污染造成的长远因果遗留。
4.3 房屋的负面标签

除了人口普查数据,Table 6考察了真实房地产交易数据。结果显示,历史污染增加一个标准差,当代房价会显著降低约10-11%。哪怕控制了具体的房屋特征,价格依然有6-8%的折价。这说明曾经受污染的社区遗留下来了更小、更密集的劣质房屋,资本市场依然在为百年前的污染历史贴上负面标签。
4.4 不同污染程度导致的异质持续性

这张图非常精妙,它揭示了动态演化的非线性和Tipping Point。横轴是根据历史污染划分的1到10个组别。右图展示了40年间的演化趋势:对于历史污染较轻的1-5组,趋势向下,说明它们在发生均值回归;但对于污染严重的6-10组,曲线呈现反转。历史污染越严重的社区,在这个40年里变得更加相对贫困。
05
结构模型
简约式证据确立了两个事实:历史污染导致了1881年的初始社区分层,而且这种分层格局一直持续到2011年。但是简约式无法回答三个核心问题:为什么这种格局会持续?在持续机制中,自然禀赋(amenities)和社会互动各自扮演什么角色?如果在反事实情境下,比如历史上从未有过污染,或者不曾推行公共住房政策,现实会是什么样?
因此文章构建了一个结构模型。结构模型有两个关键用途:其一,将持续性分解为基本面因素(如固定地理禀赋)与邻里效应(如社会互动与搬迁摩擦)各自的贡献;其二,支持在数据之外做反事实模拟实验,定量评估政策效果。
5.1 模型设定
首先,这是一个离散时间无限期的模型。城市中存在J个邻里,用下标j标记。城市中的家庭分为高地位(H型)和低地位(L型)两种类型。H型家庭在总人口中占比η,L型家庭占比1 − η。
每一期,家庭面临一个随机的搬迁机会冲击。具体来说,以概率θ停留在当前邻里;以概率1 − θ获得自由选择任意邻里的机会。参数θ捕捉的正是搬迁摩擦或居民对当前位置的依附性。
邻里之间的差异体现在两个维度:禀赋水平和租金。家庭在做居住选择时,会权衡这两个因素。
有了基本环境设定,我们接着看家庭每一期从居住在某个邻里中获得的效用。流量效用的函数形式如下:

其中:是家庭在期住在邻里获得的流量效用(请注意这里的效用是家庭所在街区带来的,并非每个家庭具体的效用);是邻里禀赋(不仅包括物理环境质量,也包含邻里社会构成带来的效应,比如与同类群体共同居住的偏好(homophily));是家庭收入,是邻里的租金,因此代表支付租金后的可支配收入; 关于两个参数均单调递增。
这个效用函数说明:禀赋好的邻里(高a)也往往对应着更高的租金(高r),因此家庭需要在宜居性与可负担性之间做出取舍。
然后,定义了家庭的效用价值函数:

是家庭在期住在邻里的价值;是个人特有的偏好冲击,服从第一类极值分布(Gumbel分布),这是离散选择模型中的标准假设,便于推导出Logit形式的选择概率;是折现因子;是留在原邻里的概率;是下一期获得搬迁机会时的搬迁者价值函数。
请注意这里价值函数的结构:以概率θ家庭下一期继续留在当前邻里,以概率1−θ家庭获得重新选择的机会。这体现了搬迁选择权的期权价值:即便当期被锁定在某个邻里,家庭也会在贴现后的预期效用中内化未来重新选择的可能。
当家庭获得搬迁机会时,它面临的是一个标准离散选择问题:

搬迁者选择使总价值最大的街区,而总价值包括:当期流量效用,个人特有偏好冲击 ,以及下一期留在该邻里的贴现期望价值。搬迁者面临的是一个在所有个邻里间的前瞻性选择。他们不只看当期的流量效用,还要考虑邻里未来。
将所有搬迁者的最优选择加总,就得到了每个邻里的需求函数。由于家庭是前瞻性的,需求取决于邻里效用的整条未来路径,而不只是当期的值。
聚合了异质搬迁者(请注意,有*号的均为搬迁者选择)的选择的Logit需求方程为:

分子是邻里j的贴现期望效用流的指数,分母是对全城所有邻里求和的标准化项,是标准Logit的结构。折现因子同时考虑时间折现β以及τ期后仍然留在同一邻里的概率θτ。因为只有还在那个邻里时,对该邻里的价值才是相关的。
在两类型家庭(H和L)的框架下,每类搬迁者家庭(有*号)有各自的需求函数,反映其收入差异。取对数后有:

实际的邻里构成(请注意此处无*号,是总量中的比例)按如下方式演化:

这是整个模型中持续性的来源,可以将其理解为一个AR(1)的过程:即便市场需求n*发生了剧烈变化,实际邻里构成也只能缓慢调整。调整速度取决于θ,θ越高,摩擦越大,调整越慢,持续性越强。
土地市场在每期每个邻里均出清。均衡条件要求总需求等于固定供给:

其中是全市H型家庭的比例,是邻里的固定住房供给(短期内不变)。结合前面的需求系统,这就闭合了整个模型,邻里构成与租金在均衡中联合决定。
为使模型在实证中可操作,作者引入了对社会构成变量的一个便利变换。这一变换自然地从对两类型需求取对数之比、再结合市场出清条件推导而来。

F函数实际上就是logit变换,即ln(1-x)/x。它能够线性化需求系统,将非线性的Logit结构转化为可以直接估计的线性方程。
有了F函数这个工具,现在来推导模型的核心可估计方程。首先,结合状态转移方程和需求方程,可以写出完整的无穷期动态需求:

但由于无穷期求和不可直接估计,利用向前迭代(forward iteration),可以将其简化为:

左侧是当期F变换需求减去贴现后的下期期望F变换需求;右侧是当期两类型效用差加时间效应。其中,括号内的项 是从状态转移方程反推出的当期流入搬迁者的隐含比例,sjt是邻里j中H型家庭的实际占比。
因此作者无需追踪无穷期预期的数据,而是只需三期数据就能估计模型。
5.2 识别与参数估计
为了进行估计,需要给效用函数g(·) 赋予具体形式。作者将流量效用设定为禀赋与可支配收入的乘积形式:

其中 代表家庭类型。禀赋指数包含禀赋与社会构成效应(homophily),即对与同类群体共同居住的偏好;是类型特的收入(外生给定);是租金。
这种乘积形式意味着禀赋对效用的边际贡献随可支配收入的增加而增加,也就是说高收入群体对高禀赋邻里的偏好更强。这是产生邻里分层的内在机制。
综合以上所有设定,我们得到最终的估计方程:

F变换的当期减去贴现后的下期,等价于将无穷期前瞻压缩为相邻两期的动态差分;
是核心参数,表示社会互动/同质性偏好效应。的符号和大小揭示H型家庭是否偏好H型比例更高的邻里,则捕捉这一效应的曲率(非线性程度);
:邻里固定效应,吸收所有时间不变的固定禀赋差异;
还加入了城市×时间固定效应以及其他控制变量,控制城市层面的宏观冲击和其他变量。
该方程由广义矩估计(GMM)来求解,利用历史污染×年份哑变量的交叉项作为工具变量。模型中需要识别的参数包括θ(搬迁摩擦)、α₁(同质性偏好强度)、γ(曲率)和β(折现因子)。
①面临两个主要的识别挑战:
第一,社会互动的内生性(reflection problem)。当期邻里构成sjt同时既是效用的决定因素,也是均衡的结果,不能直接作为回归变量。第二,sjt与未观测固定效应 ζ相关,因为好的邻里先天禀赋好,也天然吸引更多高技能居民,产生选择性偏误。
②针对这些挑战,识别策略如下:
θ的识别:来自邻里构成的均值回归速度。搬迁摩擦越大,调整越慢,持续性越强。
α₁和γ的识别:来自邻里内部随时间的变化(within-neighborhood variation over time)。
外生工具变量:以历史工业污染作为邻里初始构成的工具变量。污染冲击是外生的,它影响了1971年的邻里构成,但其本身(已于1970年代消失)不直接影响2000年代的邻里禀赋冲击。
另外将社会住房建设作为对邻里构成的外生冲击加以利用。
β校准(标准做法):不从数据估计,而是校准为与市场利率一致的数值。
最终,表7呈现了核心方程在不同工具变量和设定下的估计结果:

搬迁刚性θ:意味着在10年一个普查周期内,约有48%的居民无法自由搬迁。换算成年化,每年约有7%的居民获得搬迁机会,对应平均居住年限约为14年,这与英国住房市场观察到的实际换手率高度吻合。
折现因子β:对应年化折现率约0.7%,处于过去50年无风险利率的较低区间。
同质性偏好α₁显著为负:这里注意符号s是L型(低技能)家庭的比例,因此α₁ < 0意味着L型比例越高,邻里对高技能家庭的吸引力越低,即H型家庭具有显著的同质性偏好,偏向更多H型居民的邻里。
曲率参数γ:未发现显著的非线性。
这些结果对于不同工具变量集具有很高的稳健性,参数估计基本稳定。
5.3 反事实分析
现在进入第一个反事实实验:如果工业革命时期的污染从未发生过,今天的城市会是什么样?
方法是将1971年和1981年的邻里构成数据,减去历史污染估计的处理效应,构造出一个如同没有污染历史的反事实初始构成,然后用同样的结构参数模拟到2011年。

图13直观呈现了这一反事实实验的结果。图中每个圆圈代表样本中的一个城市,横轴是基准模拟的隔离指数,纵轴是无污染反事实下的隔离指数。其中隔离指数为:

如果污染毫无影响,所有点应该落在45度线上;若点落在45度线下方,说明污染推高了实际的隔离程度。
可以看到,对于污染程度处于前四分之一(深色圆圈)的城市,点普遍落在45度线的明显下方。无污染情境下,这些城市的隔离程度将低出约1个标准差。A图(1971年)和B图(2011年)的差异不大,说明污染的历史遗产在这40年间基本没有消退。
第二个反事实是社会住房(公共住房)政策如何影响了邻里隔离的演变?
背景是英国在二战后大规模建设了公共住房(council housing),其选址主要集中在已经处于劣势的东区(与历史污染高度重叠的区域)。那么,这究竟是强化了分层,还是缓解了分层?
本文的反事实设计是在模型中固定1971年时社会住房存量的地理分布,限制这些区域中低技能工人比例不得低于1971年水平(相当于模拟如果社会住房一直锁定在1971年的配置状态的情景)。

图14呈现了社会住房反事实的结果,分为两个子图。A图是邻里层面的模拟:纵轴是低技能工人比例,横轴是历史污染程度。实线是固定社会住房情景下2011年的模拟值,虚线是基准情景。对于高污染邻里,两条线差异不大;但对于低污染邻里,固定社会住房情景下的低技能比例更高。这正说明基准情景中这些邻里发生了更多的绅士化,而这部分绅士化是由于社会住房的流失(居民行使购买权后离开)所驱动的。
B图是城市层面的散点图:横轴是基准隔离指数,纵轴是固定社会住房情景下的隔离指数。深色圆圈代表1971年社会住房存量高于中位数的城市。可以看到,对于这些社会住房较多的城市,点明显落在45度线下方,意味着固定社会住房配置能显著降低这些城市的隔离程度。
06
结论与启示
6.1 主要结论
第一,历史污染造成了1881年的邻里分层。 污染单独可解释低技能工人比例方差的大约15%。污染每提高一个标准差,低技能工人比例约高3–4个百分点。工具变量估计与OLS高度一致;1817年(工业化前)效应精确为零,有力支持因果解释。
第二,这种分层具有惊人的持久性,历史污染到2011年仍能解释约20%的邻里构成差异。房价上,污染每提高一个标准差,当代房价约低10–11%。该效应未随污染消退而减弱,甚至略有增强。
第三,持续性的机制是动态排序加上搬迁刚性,而不仅是固定设施差异。结构估计:搬迁摩擦参数约0.48,邻里效应约-2.87。反事实表明,若无污染,污染消退后分层会很快瓦解。1980年《住房法》通过社会住房再分配进一步放大了分层。
第四,历史污染留下了多维度的剥夺遗产。高污染邻里在当代教育更差、犯罪更高、住房质量更低。分层经多元渠道自我强化,并实现代际传递。
6.2政策启示
这篇文章有重要的政策含义。
首先,污染监管不仅影响健康,还影响城市结构。今天的环境冲击可能塑造城市超过100年。但是,仅仅消除最初的原因是不够的。煤炭污染已经消失,但隔离持续存在。说明政策必须同时解决基本面和社会均衡问题。
第二,社会住房的选址很重要。把社会住房集中在本来就贫困的地区会加强隔离。混合收入住房政策可能更有效。
要打破社会均衡,可以对历史上不利的社区进行有针对性的投资,通过改善学校质量来吸引高地位家庭,通过改善交通来减少空间隔离。对发展中国家而言,今天的快速工业化可能产生由污染驱动的分选。如果不干预,这些格局可能持续几代人。因此,需要主动的环境监管和具有发展眼光的空间规划。
Abstract
Why are the east sides of formerly industrial cities more deprived? To answer this question, we use individual-level census data and create historical pollution patterns derived from the locations of 5,000 industrial chimneys and an atmospheric model. We show that this observation results from path-dependent neighborhood sorting that began during the Industrial Revolution, as prevailing winds blew pollution eastward. Past pollution explains up to 20% of observed neighborhood segregation in 2011, even though coal pollution stopped in the 1970s. We develop a quantitative model to identify the role of neighborhood effects and relocation rigidities underlying this persistence.
推文作者:
罗心怡,复旦大学经济学院直博生,欢迎学术交流。推文内容若有纰漏,敬请批评指正。
声明:推文仅代表文章原作者观点,以及推文作者的评论观点,并不代表香樟经济学术圈公众号平台的观点
0
推荐


京公网安备 11010502034662号 