植物病虫害每年造成大量作物减产,严重威胁全球粮食安全。为降低作物损失,大语言模型(Large Language Models, LLMs)通过充当智能助手,能够为农户提供及时且精准的决策支持,从而缓解精准农业服务获取难的问题。然而,现有研究在精度方面仍存在不足,其主要原因在于忽略了农业生产过程的时间敏感性,通常将领域知识视为与时间无关,未能充分考虑作物物候进程及病虫害发生周期对决策建议的影响。
针对这一问题,本文提出了一种时序感知的检索增强生成框架(Time-Aware Retrieval-Augmented Generation, TARAG),该框架由三个核心模块构成:时序感知知识库构建模块、混合检索模块以及基于时间约束的生成模块,用于提供精准的病虫害防控建议。
首先,时序感知知识库构建模块从非结构化文档中提取信息并构建带有时间标注的知识库,为模型提供补充的农业知识支持;其次,混合检索模块通过粗粒度稀疏检索确保结果的相关性,并结合时间敏感的重排序机制,在语义匹配的基础上进一步实现与用户查询的时间对齐;最后,时序感知生成模块利用检索得到的前k个相关文档及指令提示(instruction prompt),生成最终的决策建议。
为验证所提框架的有效性,本文构建了首个双语、带时间标注的农业问答数据集 TAQA。实验结果表明,与当前主流检索增强生成(RAG)框架相比,TARAG 在检索精度和建议质量方面均显著提升,其检索召回率达到99.14%,生成建议的F1值为66.85%。
本研究所提出的框架及数据集已开源(https://github.com/lee-hash1/agri_rag),为基于大模型的精准农业决策支持提供了新的技术路径。