👇 连享会 · 推文导航 | www.lianxh.cn


温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

作者:王美甜 (东北财经大学)邮箱:1146804766@qq.com
编者按:本文主要整理自下文,特此致谢!Source:Keane, Michael, and Timothy Neal. 2020. “Climate change and US agriculture: Accounting for multidimensional slope heterogeneity in panel data.” Quantitative Economics 11 (4): 1391-1429. -Link- -PDF- -Appendix- -Replication-
Keana and Neal (2020) 探讨了未来气候变化对美国农业生产力的影响。为分析生产力对不同天气条件的适应性 (Adaptation),实证研究强调了天气与作物产量在空间和时间上变动的重要性。农作物产量受气候变化影响的程度,取决于农民的适应能力,如使用耐热杂交种子、增强田间保水性、实施灌溉或优化播种密度等。历史数据表明,这种适应性在生产中呈现显著的空间和时间异质性。为此,作者通过生产函数的截距与斜率捕捉这种异质性,以更准确描述适应能力对农业生产力的影响。
为此,他们提出了一种新的面板数据估计方法——Mean Observation OLS (MO-OLS),用于估算 1950-2015 年间美国县级玉米产量。该方法允许所有回归参数 (截距和斜率) 在截面和时间维度上均具有异质性 (参数为 ,而非仅限于 和 )。结果显示,高温对产量的影响存在显著异质性,且随着高温天气的普遍化,这种异质性逐渐减弱。这为历史上温暖县与凉爽县之间适应性差异提供了有力证据。此外,研究还发现,传统固定效应模型因限制斜率的异质性,导致对高温影响的估计出现偏差,并显著降低了模型的拟合效果。
作者利用 19 种气候模型、3 条排放增长路径和 4 种计量模型,生成截至 2100 年的县级玉米产量综合预测,结果显示气候模型预测存在较大不确定性。如果仅依赖农业技术进步和对温度的适应性而未实施减排政策,玉米产量增长将远低于人口增长;而在农业技术进步的基础上,结合减排政策和适应性措施,玉米产量增长则有望与人口增长保持基本一致。
本小节介绍平均观测值最小二乘回归 (Mean Observation OLS/MO-OLS) 的估计原理。这是一种首个在空间和时间维度上允许斜率固定效应异质性的可行面板数据估计方法。以下为包含固定效应的斜率和截距的一般模型:
其中,
一种直接估计该模型的方法是通过包含以下变量的 OLS:
对于大型面板数据,这在计算上是不可行的,因为它包含了 个解释变量,使得求 的逆或者求解线性方程组 是不可行的。
为了解决上述问题,MO-OLS 通过运行一系列可行的回归构建了 的一致估计量,然后通过误差修正项修正偏差 (bias)。MO-OLS 通过结合混合回归 (pooled OLS)、个体 层面 (-specific) 的回归以及时间 层面 (-specific) 的回归来做到这一点。
首先,将模型重新写为:
通过混合回归 OLS 估计 :
将 代入上式可以得到:
其中,。
其次,我们进行个体层面的回归:
同样,我们使用 OLS 构建 的估计量:
将 代入上式可以得到:
其中,。
最后,我们进行时间层面的回归:
同理,时间层面的 OLS 估计量可以推导得到:
其中,。
结合混合回归 (pooled OLS) 、个体 层面 (-specific) 的回归以及时间 层面 (-specific) 的回归结果,我们可以构建 的初步的估计量:
需要注意的是,初步估计量是有偏的,我们可以将估计量展开来理解偏差的性质:
我们将上式简写为:
其中, 以及 , 以及 的定义是类似的。
(1) 式可以被分解为三个部分:
在给定 和 的假设的情况下,误差 (errors) 渐进消失。
关键之处在于,偏差项 可以根据 (1) 式精准计算并消除,进而构建 的一致估计量。我们进一步的解释估计步骤:MO-OLS 第一步在 中用 来近似估计 来得到 和 ,并且在 中用 来近似估计 来得到 和 。将 和 的定义代入到偏差项中,可以得到:
这个表达式 (2) 相当于原本的偏差 加上一个与 和斜率异质性相关的偏差。用 (1) 式减去 (2) 式,我们可以消除原本的偏差,但是却引入了一个新的偏差。重要的是,新的偏差必须比原本的偏差要小 (这一点在文献附录中得到了证明)。
我们可以重复这个过程,再次用 和 来近似估计 (2) 式中新的偏差项。此时,和前面类似,产生了一个新的更小的偏差项。因此,可以重复迭代这个过程 次,使得偏差任意小,消除偏差的估计量为:
其中,当 时,,,且 。他们是一个柯西列 (Cauchy sequence) ,因此选择合适的 可以使序列在收敛到合适的容差是终止。实践上,一个较小的 通常就够了。(3) 式是一个容易构建的估计量,因为它只与初始估计值 以及协变量 有关。
定理 1 说明了当 趋向无穷, 和 联合趋向无穷时,MO-OLS 对观测值水平的系数 的估计是一致的。
Theorem 1 (Consistency of ):MO-OLS 模型在假设 1-4 下,如果 且子序列 ,那么
Remark:假设 4 提出 ,单独讨论每一个分量 的一致性是没有意义的,因为他们仅仅在对应观测值处被识别。
给定 的一致估计,研究人员可以根据事后需要进行研究。有些情况,研究人员可能对系数向量的均值 感兴趣,在观测值水平系数估计一致的情况下,平均系数向量可以通过简单平均来估计:
我们将此称为平均观测 OLS (MO-OLS)估计,因为它对观测级系数进行了平均。下面的定理将说明平均系数估计量是一致的且渐进正态的。
Theorem 2 (Consistency of ):MO-OLS 模型在假设 1-4 下,如果 且子序列 ,那么
Theorem 3 (Asymptotic Normality of ):MO-OLS 模型在假设 1-4 下,如果 且子序列 ,使得 且 ,那么
其中,。渐近方差可以用非参数一致估计:
其中,,。
Remark:MO-OLS 通过在存在时间固定效应的情况下提供了平均效应 的一致估计,扩展了 Pesaran and Smith (1995) 提出的 mean group regression (MG-OLS)。时间固定效应会使得 MG-OLS 的估计不一致。
作者关注的并非天气对玉米产量的平均影响,而是基于个体水平的影响 。为了检验 MO-OLS 估计的准确性,作者首先使用传统的固定效应回归模型 (FE-OLS) 进行估计,并将 FE-OLS 和 MO-OLS 两种模型估计结果对比,发现当模型中存在与回归变量相关的多维斜率异质性时,MO-OLS 能够对系数做出有效且一致的估计,而传统固定效应模型则会产生有偏估计。
首先,作者利用传统固定效应回归模型 (FE-OLS) 构建模型 (4):
其中, 表示国家 在第 年的玉米产量对数, (Growing Degree Days) 表示作物处于适宜生长温度下的总小时数, (Killing Degree Days) 表示作物处于有害高温下的总小时数, 表示生长季的总降水量, 和 分别代表个体和时间固定效应。作者认为,在考虑适应性时,高温对作物的影响可以被建模为 的对数线性函数,因此公式改写为模型 (5):
对 的边际影响如下:
相比于传统的 FE-OLS,作者提出了一种更灵活的新方法 (MO-OLS),用于估计同时具有空间和时间异质性的 ,详见模型 (6),具体推导过程详见第 2 小节。与固定效应回归相比,MO-OLS 更加灵活,无需预设 系数的特定形式;相反,该方法允许回归系数与回归变量相关 (本文中, 与 相关)。此外,MO-OLS 在一定程度上缓解了大型面板数据中估计异质回归系数的难题,因为直接使用 OLS 可能会耗尽所有自由度。
其中, 可拆解为下式:
本文数据来源分为两部分:1950-2015 年的县级农作物产量数据来自美国农业部国家农业统计局;温度和降雨量数据则来自 Schlenker and Roberts (2009)。温度和降雨量数据包括 1950-2015 年美国县级每日最高温、最低温及降雨量信息。
通过以下正弦函数可大致估计出农作物每天暴露在某一温度区间的小时数:

其中 为摄氏度, 和 为每天最高/低温度, 且 。
将 0-29 摄氏度作为利于谷物生长的温度,29 摄氏度以上作为不利于谷物生长温度,则城市 在第 天的 和 分别表示为:
作者假设每年谷物生长季节为 5 月 1 号至 9 月 30 号,把谷物在生长季节的 和 加总求和即可得到模型中 和 ,即谷物每年经历的有利温度小时数和有害温度小时数。
FE-OLS 估计结果如下表所示,该回归包含了个体和时间固定效应,但没有考虑异质斜率系数。第 (1) 列和第 (2) 列为没有引入适应行为时模型估计结果。第 (1) 列中模型控制了县域固定效应和时间固定效应,KDD 系数为-0.0052,表明高于高温每增加一个小时,将导致谷物产量减少 0.52%。第 (2) 列将时间效应限制为二次型,估计结果与第 (1) 列差别很小。
第 (3) 列是考虑适应性后的模型估计结果,作者通过在模型引入 KDD 的对数线性函数表示对高温的适应性。新加入的回归项回归系数显著为正,说明随着 KDD 的增加,KDD 对作物产量的负面边际效应变小,这可能是由于农民和自然的对天气的适应性。从第 (3) 列可以看出 KDD 的平均边际效应为-0.0082,要比第 (1) 列和第 (2) 列显示的负向效应更大,说明忽略适应性的标准 FE-OLS 模型会导致有偏估计。

下表是 MO-OLS 估计结果,表格显示了 KDD 的未加权平均悉数、加权平均系数、中值系数等数据。KDD 的未加权平均系数为 -0.0096,这意味着高温天气每增加一个小时,将导致谷物产量平均下降 0.96%。

下图为各个县在不同时期的 KDD 系数分布图。可以看出各县之间 KDD 系数存在显著的异质性,且 1025 百分位数的范围(即较低的浅灰色区域)比 75 90 分位数的范围宽得多,说明该分布呈现左肥尾。从图中还可看出中值 KDD 数随着时间的推移呈现出明显的趋势,从 1950 年一直增长到 80 年代末,随后稳定基本不变。由此可见系数异质性是存在意义的,如果使用 FE-OLS 则会忽略了系数异质性的重要性。

另外,作者还对每年的中位数系数进行了线性时间趋势回归,并检验了结构趋势的断裂,结果如表所示。分析表明,1988 年之前 KDD 系数呈正趋势,表明产量的热敏感性降低,支持适应性假设。然而,1989 年发生了一次重大突破,同时1988-89 年美国中西部经历了一场极端干旱。此后,KDD 系数的时间变化趋势变得微弱且不显著。2015 年的 KDD 系数中位数与上世纪 70 年代相似,表明在过去 40 年中,农产品在适应高温方面缺乏持续性进展。总体来看,KDD 系数在样本的前半段表现出强劲的上升趋势,表明美国玉米产量适应了 20 世纪 50 年代至 80 年代的高温。

作者考察了玉米产量对热敏感性的地理格局,下图展示了样本中各县 KDD 系数平均值的分布情况。结果显示,敏感性最高的地区主要集中在北达科他州、南达科他州、明尼苏达州及美国东北部。玉米带大部分地区和东南部的敏感性范围在 -0.010 到 -0.005 之间,而敏感性较低的县则主要位于德克萨斯州、俄克拉荷马州和堪萨斯州。这表明,不同地区的热敏感性存在系统性差异:在温度较低的北部地区,谷物对高温的敏感性更强,而在温度较高的南部地区,谷物对高温的敏感性较弱,原因在于南部地区的农户和自然环境对高温的适应能力较强。

下图展示了 和 的散点图,以及 在 上的回归近似对数线性关系的最佳拟合曲线。结果显示,随着 KDD 的增加, 逐渐下降,表明玉米对高温的敏感性降低。这是因为在更高的 KDD 水平下,农户有更多动力提升适应性,从而降低玉米对高温的敏感性。

下图比较了 FE-OLS 和 MO-OLS 两种估计模型中 KDD 与系数 之间的关系。结果显示,MO-OLS 估计出的 绝对值较大,表明高温对谷物产量的负向影响更显著。然而,MO-OLS 估计曲线仍在 FE-OLS 估计曲线的 95% 置信区间内。
从 和 KDD 的关系来看,KDD 从 0 增加到 100 的过程中,适应性发挥了重要作用。然而,在更高的 KDD 水平上,曲线逐渐变平,适应性效应减弱。这表明,如果未来适应行为没有显著进步,并保持与过去一致,当 时,适应性对减轻高温对谷物损害的作用将非常有限。

首先,作者通过 19 种气候模型和三条排放增长路径 (RCP85/RCP45/RCP26) 预测未来天气情景,包括各县每日最低/最高温度和降雨量。基于这些数据,计算得出 、 和 ,并求均值得到 、 和 ,其中 代表排放情景, 代表气候模型。
接着,利用以下 4 种计量模型预测未来玉米产量:
模型(7) 为不包含适应性的 FE-OLS 模型:
模型(8) 为包含适应性的 FE-OLS 模型:
模型(9) 为不包含适应性的 MO-OLS 模型:
模型(10) 为包含适应性的 MO-OLS 模型:
下表为利用以上 4 种计量模型预测的未来玉米产量,括号内为 80% 的预测区间。
横向来看,1、2 列为不包含适应性的 FE-OLS 和 MO-OLS 估计结果。在 RCP85 的排放情景下,MO-OLS 估计结果显示截至 2100 年玉米平均产量将减少 70%,FE-OLS 结果显示截至 2100 年玉米平均产量减少将 62% 。这与前文提及的传统 FE-OLS 导致结果的低估相一致。第 3、4 列为包含适应行为的模型估计结果,与 1、2 列对比可以看出,适应性能够缓解气候变化对产量的负向影响。
纵向来看,随着温室气体排放量的减少 (RCP85-RCP45-RCP26),KDD 的系数绝对值逐渐减小,适应性作用也随之减弱。以第二列和第四列为例,在 RCP85 排放路径下,到 2100 年,适应行为可减少 34% 的产量损失;在 RCP45 路径下,减少 10%;而在 RCP26 路径下,仅减少 2%。

下图显示了在不同排放增长路径下产量下降幅度,结论与上表相同。

作者通过以下公式计算未来玉米产量的总损失,其中 为 RCP 排放增长路径, 表示是否采取适应行为,若采取则 = 1,若不采取则 = 0。
相较于 RCP=85 且无适应性的基准情况,不同的排放增长路径和适应性组合可减少的产量损失份额为:
下表为 4 种不同的情形可减少的产量损失情况。从表中可以看出仅实行适应行为并不能大幅减少损失,为避免未来产量大幅下降,必须实行减排政策。

下图显示以上 4 种情形下,正在经历产量损失的县占所有县的百分比。在 RCP85 且无适应性时,2100 年几乎所有的县都会经历损失。在 RCP26 且有适应性时,2040 年以后约有 60% 的县会经历产量损失,即 40% 的县产量不减反增,说明实行减排政策并辅以适应性可以减缓高温对谷物产量的负面影响。

A.考虑农业技术进步
以上分析假定未来农业技术水平不变。作者在此部分预测了在农业技术进步的情况下未来谷物产量的变化。如果仅有农业技术进步和适应性而未实施减排政策,则玉米产量的增长将显著落后于人口增长;若同时存在农业技术进步并实施减排政策配合适应行为,则玉米产量的增长可以与人口增长大致保持一致。
B.将大豆作为代表性谷物
以上分析以玉米作为代表性谷物,作者在本部分选取大豆作为研究对象,探讨气候变化对产量的影响。由于大豆对高温的敏感性较低,KDD 系数的异质性较小,且与 KDD 之间的相关性较弱,适应性对大豆的影响较小。但减排政策仍能发挥显著作用。
作者创新性地提出了 MO-OLS 模型,以估计 1950-2015 年间气候变化对美国农业产出的影响,该方法允许所有回归参数(截距和斜率)在截面和时间上具有异质性。为检验该方法的准确性,作者将 MO-OLS 估计结果与 FE-OLS 估计结果进行了比较,发现两种方法均表明高温对谷物产量产生负面影响。然而,FE-OLS 忽略了斜率异质性,导致模型结果存在偏差。MO-OLS 模型的估计是一致的,且 KDD 的系数 显示出空间和时间上的异质性,证明了农民和自然对高温的适应性。
作者利用四种计量模型预测未来气候变化对玉米产量的影响,结果显示:
Note:产生如下推文列表的 Stata 命令为:
变系数 时变 异质性, m安装最新版lianxh命令:ssc install lianxh, replace

尊敬的老师 / 亲爱的同学们:
连享会致力于不断优化和丰富课程内容,以确保每位学员都能获得最有价值的学习体验。为了更精准地满足您的学习需求,我们诚挚地邀请您参与到我们的课程规划中来。请您在下面的问卷中,分享您 感兴趣的学习主题或您希望深入了解的知识领域 。您的每一条建议都是我们宝贵的资源,将直接影响到我们课程的改进和创新。我们期待您的反馈,因为您的参与和支持是我们不断前进的动力。感谢您抽出宝贵时间,与我们共同塑造更加精彩的学习旅程!https://www.wjx.cn/vm/YgPfdsJ.aspx# 再次感谢大家宝贵的意见!


New! Stata 搜索神器:
lianxh和songblGIF 动图介绍搜: 推文、数据分享、期刊论文、重现代码 ……👉 安装:. ssc install lianxh. ssc install songbl👉 使用:. lianxh DID 倍分法. songbl all

🍏 关于我们
