GLOBAL · AGRICULTURAL · DATA全球农业管理数据集大全
—— 氮磷钾、农药、耕作、播期、收获与畜牧水产 ——
A Curated Atlas of Global Agricultural Management Datasets
人类对地球系统最深刻、最持续的干预,既不在城市,也不在工厂,而在田野。每一公斤被施入土壤的合成氮、每一次旋耕翻动的土层、每一片被刈割的麦穗、每一个网箱里的鱼群——都是一次管理决策的物理化体现。
将这些决策空间化、栅格化、时间序列化,是过去二十年农业地理学、地球系统科学与可持续发展研究最重要的基础工程之一。它的成果,是一组散落在 Nature Scientific Data、Earth System Science Data、NASA SEDAC、FAO 等机构的全球管理变量数据集。
本文按变量类型归类,梳理目前最具代表性的十六个全球数据集,涵盖肥料投入、农药使用、耕作制度、种植日历、收获与产量、畜牧分布与水产养殖六个维度——它们共同构成了"人类如何管理这个星球的农业系统"的可计算基底。
PART ONE · NUTRIENTS
养分投入 · 氮磷钾的全球分布
Nitrogen, Phosphorus, Potassium · Synthetic & Manure
化肥用量是 20 世纪以来人类对地球氮循环最剧烈的扰动。自 1961 年以来,全球氮、磷化肥单位面积用量分别增长了约 8 倍与 3 倍,但这些数字若不空间化,就无法用于地球系统模型、面源污染评估或可持续路径设计。
DATASET · 01
NPKGRIDS
全球氮磷钾化肥施用率栅格数据集 · 173 种作物 · 2020
在 0.05° 分辨率(赤道处约 5.6 公里)上,提供 N、P₂O₅、K₂O 三类无机肥料在 173 种作物上的施用率(2020 年)。
数据集采用数据融合方法,将 CROPGRIDS 作物分布与已发表的多源数据整合,可与全球作物模型直接耦合。
引用 · Nature Scientific Data, 2024 | 分辨率 · 0.05°
DATASET · 02
Crop-Specific N Fertilization 1961–2020
长时段作物特定氮肥施用栅格数据集
提供 1961–2020 年全球作物特定氮施用量的栅格估计,按肥料类型与施用方式分类。
除了合成氮,还区分 NH₄⁺ 与 NO₃⁻ 形态、作物残体(CR)与畜禽粪肥(MA)三大氮源,并提供 21 个作物组的逐年数据——是少有的将氮的"形式""来源""时序"三轴打通的产品。
引用 · Scientific Data, 2023 | 分辨率 · 5 弧分
DATASET · 03
Lu & Tian N&P Fertilizer 1900–2013
百年尺度合成氮磷化肥使用率栅格(0.5°)
在 0.5° 分辨率上重建 1900–2013 年全球农田合成氮、磷化肥逐年用量,并与 HYDE 3.2 历史土地利用图配套。
它是大量地球系统模型用以驱动百年尺度氮循环模拟的"基础底盘"——在它出现之前,大多数模型只能用静态、空间均一的化肥假设。
引用 · ESSD, 2017 / PANGAEA | 分辨率 · 0.5°
DATASET · 04
Global Fertilizer and Manure v1
全球肥料与粪肥氮数据集 · NASA SEDAC
基于 FAO 全球网格化牲畜数据(GLW)的密度乘以单位排泄率,在格点尺度估算粪肥氮的产生与施用量。
把"动物在哪里"翻译成"氮排泄落在哪里"——是畜牧×土壤氮收支耦合研究的核心输入。
来源 · Potter et al. / CIESIN | 主题 · 粪肥氮空间化
PART TWO · PESTICIDES
农药施用 · 有效成分的栅格化
Active Ingredients on Crops · from kg/ha to Risk Surface
FAO 报告 2015 年全球农药施用总量达 410 万吨,自 2000 年以来增长 35%。但与化肥不同,农药数据长期被卡在国家总量层面——直到 PEST-CHEMGRIDS 出现。
DATASET · 05
PEST-CHEMGRIDS
全球作物特定农药有效成分施用率栅格数据集
包含 20 种使用最广的农药有效成分,在 6 种主要作物与 4 个聚合作物类别上的施用率,5 弧分分辨率,2015 年估值,并外推到 2020 与 2025。
方法上采用空间统计技术,融合 USGS/PNSP 与 FAOSTAT 农药数据库,辅以全球土壤、水文气候、农业与社会经济变量。
它是当下生态毒理、面源污染、水体农药残留模拟绕不开的输入层。
引用 · Maggi et al., Scientific Data, 2019 | 分辨率 · 5 弧分
PART THREE · TILLAGE
耕作制度 · 土地翻不翻、怎么翻
Tillage Systems & Conservation Agriculture
耕作方式决定土壤碳储量、侵蚀速率与机械化能耗。但"全球哪块地是免耕的"这个问题,直到 2019 年才有了像样的数据答案。
DATASET · 06
Porwollik Global Gridded Tillage
基于规则的全球栅格化耕作系统数据集
将全球耕作实践归为六类:保护性农业下的免耕、传统年耕、传统轮作耕、轮作耕、减耕、常规年耕;在 5 弧分作物特定农田上分配。
分配规则综合作物类型、水分管理、田块大小、水蚀、收入与干燥度等条件,并对 54 个国家用概率方法降尺度报告的保护性农业面积。
引用 · Porwollik et al., ESSD, 2019 | 分辨率 · 5 弧分
DATASET · 07
Su et al. CT vs NT Yield Database
全球常规耕作 / 免耕系统配对产量数据集
最终数据集包含 1980–2017 年间 50 个国家、8 种主要主粮作物的 4403 对配对产量观测,直接对比常规耕作(CT)与免耕(NT)。
同时报告生长季气候变量(降水、潜在蒸散、平均/极值温度)与土壤特性,使研究者得以分离土壤、气候与农艺因素对产量差异的贡献。
引用 · Su et al., Scientific Data, 2021 | 类型 · 田间试验荟萃
PART FOUR · CROPPING SYSTEM
种植制度 · 什么时候种、种几季
Crop Calendar · Cropping Intensity · Irrigation
复种指数、播期、灌溉与雨养的空间格局,共同决定了一块土地一年究竟产出多少粮食。这一类数据集,是连接气候模型与产量模型的关键接口。
DATASET · 08
Sacks Crop Calendar
全球作物播期与收获期数据集
通过数字化和地理参考化已有观测,构建了 19 种主要作物的全球播期与收获期数据集,并将其与 CRU 月气候图叠加,推导出例如"种植发生时的平均温度"等气候统计量。
它是过去十余年最常被引用的全球作物日历——从 GGCMI 到几乎所有全球作物模型,大多以其为初始播期假设。
引用 · Sacks et al., GEB, 2010 | 作物 · 19 种
DATASET · 09
GGCMI Phase 3 Crop Calendar
全球作物模型互比第三阶段日历
在 0.5° 网格上为 18 种作物提供播种日与成熟日,并区分雨养与灌溉系统;对当前未耕作区域进行空间外推与缺失补全。
可视为 Sacks 日历在新一代数据更新与方法体系下的"模型友好版"。
引用 · Jägermeyr et al. | 分辨率 · 0.5°
DATASET · 10
MIRCA-OS / MIRCA2000
全球月度灌溉与雨养作物面积数据集
基于次国家级作物特定灌溉与雨养收获面积统计与全球网格化土地覆盖产品,生成 2000–2015 年、5 弧分、23 种作物类的逐月数据。
MIRCA-OS 是 MIRCA2000 在 21 世纪的开源更新版,允许研究者把"某月某地是否在生长某作物"作为基础变量进入水文与产量模型。
引用 · Scientific Data, 2025 | 分辨率 · 5 弧分 / 月
DATASET · 11
GAEZ v4 · Global Agro-Ecological Zones
全球农业生态区划 · FAO & IIASA 联合产品
提供作物适宜性、潜在产量、土地资源、水资源等多层栅格,用于产量差距(yield gap)、土地承载力与情景模拟分析。
与 FAOSTAT 国家统计互校,是"潜在 vs. 实际"分析框架的国际基准。
来源 · FAO & IIASA | 主题 · 适宜性 / 潜在产量
PART FIVE · HARVEST & YIELD
收获与产量 · 复种指数与作物分布
Harvested Area · Cropping Intensity · Yield Surface
收获面积(harvested area)与物理面积(physical area)的差,正是复种指数(cropping intensity)。把这一对变量分开,是过去十年全球农业地理最关键的方法论进步之一。
DATASET · 12
CROPGRIDS
全球 173 种作物收获与物理面积数据集 · 2020
在 0.05° 分辨率上提供 173 种作物 2020 年的收获面积与作物物理面积;若一块田一年被收获两次,在收获面积统计中计两次,而物理面积只计一次。
CROPGRIDS 是数据融合平台,整合了 28 个数据源、52 个国家的国家统计与 FAOSTAT 数据——这两个变量的差,正是复种指数的直接表达。
引用 · Scientific Data, 2024 | 分辨率 · 0.05°
DATASET · 13
MapSPAM
空间生产分配模型 · Spatial Production Allocation Model
SPAM 在 5 弧分网格上,采用交叉熵方法整合次国家生产统计、卫星影像、农业适宜性与灌溉图、人口密度、收益潜力、市场可达性、先验作物分布,生成 42 种作物、4 种生产系统的多类估计。
它是"国家级统计如何下推到格点"这一难题的代表性解。
来源 · IFPRI / HarvestChoice | 作物 · 42 种
DATASET · 14
GGCP10
全球 10 km 栅格作物产量数据集 · 2010–2020
在 10 km 分辨率上构建 2010–2020 年玉米、小麦、水稻、大豆产量栅格,基于农业生态分区与多因素的数据驱动模型。
其训练特征包含统计数据、栅格化生产数据、农业气候指标、农艺指标、全球地表卫星产品与地面观测——是当前时空分辨率最高的全球四大主粮产量产品之一。
引用 · Scientific Data, 2024 | 分辨率 · 10 km
PART SIX · LIVESTOCK & AQUACULTURE
畜牧 & 水产 · 陆地与水的延伸
Livestock Density · Mariculture Locations
DATASET · 15
GLW 3 / GLW 4
全球网格化牲畜分布数据库
GLW 3 在约 10 km 分辨率(0.083333°)上提供 2010 年牛、水牛、马、绵羊、山羊、猪、鸡、鸭的全球密度;GLW 4 已更新至 2020 年。
提供基于随机森林的 dasymetric 加权(DA)与均匀面积加权(AW)两套版本,前者整合环境协变量,后者保持数据中性。
来源 · FAO / Gilbert et al. | 分辨率 · ~10 km
DATASET · 16
Clawson Mariculture Map
全球海水养殖空间分布数据集
汇总已知海水养殖位置,采用基于离岸距离、港口距离与已知农场平均产量的简单生产分配方法,把全球 73 个国家的海水养殖位置图绘出来,覆盖 2017 年报告中 96% 的鱼类与无脊椎动物海水养殖产量(不含藻类)。
它是首个公开的全球海水养殖空间数据库——尽管仅 17% 的农场具有已知精确位置,其余 83% 通过适宜性信息推算。
引用 · Clawson et al., Aquaculture, 2022 | 覆盖 · 73 国
SYNOPSIS
变量×数据集 速查
A Variable-to-Dataset Cheat Sheet
| 管理变量 | 推荐数据集 | 分辨率 |
|---|
| NPKGRIDS | |
| Wang/Tian 1961–2020 | |
| Lu & Tian 1900–2013 | |
| Potter Manure N | |
| PEST-CHEMGRIDS | |
| Porwollik Tillage | |
| Su CT/NT Database | |
| Sacks · GGCMI Ph3 | |
| MIRCA-OS | |
| GAEZ v4 | |
| CROPGRIDS · SPAM | |
| GGCP10 | |
| GLW 3 / 4 | |
| Clawson Mariculture | |
把氮、磷、农药、耕作、播期、产量、牲畜与鱼塘栅格化,意味着我们获得了在地球系统模型中"如同操控变量"般操控全球农业的能力。这是科学的胜利,也是伦理的张力所在。
这些数据集多半是"基于规则的估计"——它们用国家统计、卫星影像、专家知识与机器学习,把碎片缝合成连续的表面。理解它们的不确定性边界,与使用它们的能力同样重要。
在 AI 与全球可持续农业研究深度交融的今天,数据集既是科研的基础设施,也是关于"人类如何看待自己与土地"的隐喻。
每一个用得起这些数据的人,都站在巨人的肩膀上;但请记得,巨人也有盲区。
Nature Scientific Data · ESSD · NASA SEDAC · FAO
PANGAEA · CIESIN Columbia · SAGE Wisconsin · IIASA
HydroShare · Goethe-Universität · CGIAR · Aquaculture