研究背景:基于过程的作物模型被广泛用于模拟作物生长过程。然而,这些模型因简化过程表征和参数估计困难而存在局限性。机器学习方法作为一种新兴范式,在规避这些局限方面展现出潜力,但也因其黑箱特性(未必包含已知作物生长机制)及对大数据的需求(多数农业应用难以满足)而受到质疑。
研究内容:本研究旨在提出一种能够利用农艺学知识与稀疏观测数据进行作物多变量模拟的深度学习架构,从而为作物生长建模建立新范式。
研究方法:本研究提出了一种具有质量守恒架构的深度学习作物生长模型(DeepCGM),该架构遵循作物生长原理。针对稀疏数据集训练,额外设计了两个关于作物生理学和模型收敛性的知识引导约束。通过一项为期两年、包含105个试验田的水稻实验观测数据集,将DeepCGM与基于过程的作物模型(ORYZA2000)和两种经典深度学习模型进行对比评估,同时采用数据增强方法。为验证所提模型的有效性和泛化能力,本研究还复现了一项为期三年、共计122个试验田的水稻实验案例研究。
研究结果:DeepCGM架构能为所有模拟变量生成物理可信的作物生长曲线,而经典机器学习模型可能产生违背质量守恒定律的不合理预测。此外,与传统基于过程的模型相比,DeepCGM能更精确地模拟观测到的生长过程,所有变量的整体精度(加权归一化均方误差)在2019年提升8.3%,2018年提升16.9%。
研究结论:知识引导的深度学习能够将作物生长过程的核心机理与深度学习相融合。该方法解决了数据稀缺问题,从而促进基于多变量稀疏数据集的数据驱动型作物生长建模。
研究意义:本研究揭示了知识引导的深度学习在克服传统作物模型因简化导致的结构性误差,以及降低数据驱动模型对数据量需求方面的潜力。该模型能够从稀疏数据中自主识别作物生长的多变量动态模式,这标志着新一代作物生长模型的诞生。