近日,中国农业大学工学院苏文浩课题组联合山东师范大学、美国明尼苏达大学(University of Minnesota)及崖州湾国家实验室等多家国内外顶尖科研机构,在人工智能驱动的大豆精准表型评价领域取得突破性进展。针对传统育种中人工表型采集时效性差、复杂群体产量预测难等瓶颈,团队在国家重点研发计划“政府间国际科技创新合作”等项目的资助下,创新性地提出了一种改进的RT-DETR(Real-Time Detection Transformer)深度学习架构的感知新技术。该技术成功突破了大豆植株细长拓扑结构与密集遮挡目标解析的行业难题,实现了对单株大豆豆荚数、籽粒数及茎枝生物量等多维表型的全自动、非破坏性实时监测。通过构建“感知-融合-映射”的完整集成学习链条,研究团队不仅实现了对单株产量的精准预估,更为高产、耐盐大豆种质资源的规模化筛选及智慧栽培监测提供了关键的数字化底座。相关核心成果已发表于农业工程领域权威期刊《农业工程学报》2026年第42卷第3期,标志着人工智能在赋能作物表型组学、加速规模化育种进程方面迈出了坚实一步。
随着全球粮食安全形势日益严峻,提升我国大豆自给率已成为国家战略重心。面对耕地资源紧缺的挑战,开发分布广泛的盐碱地资源、培育高产耐盐大豆品种,是破解产能瓶颈的关键。然而,传统育种中的表型鉴定手段效率低下、主观性强,更难以应对植株结构复杂带来的严重遮挡与形态变异,严重制约了规模化筛选的进程。因此,研发基于人工智能的高通量、非破坏性精准表型监测技术,实现对海量种质资源的数字化评价与产量预估,对于加速智慧育种进程、保障国家粮油安全具有极其重要的战略意义。然而,现有基于卷积神经网络的方法在处理密集遮挡下的豆荚检测及细长茎枝识别时,普遍存在小目标漏检率高、特征提取不完整等技术痛点。如何构建“精准感知—深度融合—可靠预测”的全链条技术体系,成为大豆智能育种领域亟待攻克的科学难题。
为解决上述挑战,研究团队以具备端到端优势的实时检测变换器(RT-DETR)为基础架构(如图1所示),针对性地研发了两大核心技术模块:
1. “鹰眼”级尺度融合模块(ASF):精准捕捉密集小豆荚
针对豆荚目标微小且尺度多变的挑战,团队在模型中深度集成了注意力量表序列融合(ASF)模块(如图2)。该模块通过多尺度特征融合与双重注意力机制,赋予模型极强的空间感知能力,如同为算法配上了“鹰眼”,在大范围搜索中依然能精准锁定被叶片遮挡的极小豆荚。实验显示,优化后模型的豆荚检测平均精度(mAP50)达到0.911。
2.“显微镜”级边缘增强模块(WFU):清晰解析茎秆拓扑结构
面对主茎与分枝细长弯曲、边界模糊的提取难题,研究引入了小波特征升级(WFU)模块(如图3)。该模块利用小波变换的频域分解特性,将图像解析为高频边缘与低频背景,通过对边缘信息的定向增强与融合,显著提升了模型对比度。这如同为算法配备了“显微镜”,有效解决了细长目标识别中常见的“断裂”与“丢枝”现象,主茎与分枝检测精度(mAP50)达到0.947。
在获得高精度表型数据(豆荚数、籽粒数、茎枝生物量面积)的基础上,团队进一步构建了基于集成学习模型的产量预测体系。研究创造性地采用了RF-PLSR(随机森林-偏最小二乘回归)投票决策策略,充分发挥了非线性拟合与线性回归的协同优势,实现了“1+1>2”的效果。
测试结果表明,该集成模型在验证集上的决定系数(R²)达到0.90,预测值与实际称重值呈现出高度的统计一致性。这一结果证实了通过视觉表型特征反演单株生物量的可靠性,为大规模产量预估提供了坚实的数据闭环。
图4 基于OpenCV的主茎和分枝面积采集流程
图5展示了基于集成学习模型预测的单株大豆产量与人工实测值的对比分析结果。图中蓝点与红点分别代表训练集与验证集的预测分布。结果显示,绝大多数样本点紧密围绕参考线(y=x)分布,表明模型预测值与实测值具有极高的一致性,充分验证了该算法优异的预测精度与稳健的泛化性能。
针对高产植株区域(>40g)出现的少量偏差,研究进一步分析认为:单株生物量较大的植株通常伴随着更高的分枝密度与结荚重叠度,这种复杂的空间构型增加了图像解析过程中对遮挡豆荚数量及茎秆面积的识别难度,从而在特征提取环节引入了微小误差。尽管存在上述极端样本的扰动,模型在全量程范围内仍表现出极强的表型表征能力。 验证集R²达到 0.90,均方根误差(RMSE)仅为 2.77g,这一高度吻合的统计结果证实了“视觉表型特征”与“产量生物学性状”之间存在稳定的非线性映射关系。
图5 集成学习模型预测与人工测量结果的比较
该模型的成功构建,为从单株精细表型跨越到群体产量预估提供了可靠路径。 通过精准获取单株产量潜力和空间构型参数,结合田间种植密度及株距信息,即可实现对单位面积产量的数字化精准预估。这一研究成果不仅为大豆单产能力的快速评估奠定了数据闭环基础,也为高产、耐盐大豆品种的规模化筛选提供了高效的数字化决策支撑。
该研究提出的感知与预测框架,不仅实现了大豆多表型的高通量、非破坏性检测,更由于其优异的推理时效性,具备了向无人化表型采集平台迁移的潜力。未来工作将聚焦于三方面深化研究:一是扩展多环境、多品种的大豆表型数据库以增强算法泛化能力;二是集成机械化作业平台实现全自动检测;三是融合多模态特征进一步精细化产量预测模型。
该研究第一完成单位为中国农业大学,参与单位包括山东师范大学、明尼苏达大学、崖州湾国家实验室等。论文作者为:孙岚琪、张琦沅、贺昱航、郭凯、杨策、苏文浩、田志喜。其中,中国农业大学苏文浩与山东师范大学郭凯教授为通讯作者。
基金支持: 该研究得到国家重点研发计划(政府间国际科技创新合作项目)、国家自然科学基金项目、中国农业大学2115人才发展计划项目以及泰山产业领军人才项目等的资助。
【图文来源】孙岚琪
【图文编辑】乔锦华
【校对】张琦沅
【审核】王启