2026年4月13日,斯坦福大学人工智能研究所(Stanford HAI)发布了《2026年AI指数报告》。

报告中指出,人工智能正以前所未有的速度重塑科学研究。2024年诺贝尔化学奖对AI驱动蛋白质结构预测与设计工作的认可,以及AI天气模型在欧洲中期天气预报中心的实际部署,标志着AI已由辅助工具逐步走向科研流程重构。
当前,AI在科学中的作用主要体现在三类:一是基于科学数据构建预测与解释模型,已较为成熟;二是辅助文献分析、实验设计和数据处理的科研工作流系统,近年来快速发展;三是能够在有限人工干预下自主生成科学发现的智能系统,虽仍处于早期,但发展势头显著。总体来看,AI在结构生物学、化学、物理和材料等数据基础较好的领域进展尤为突出,但“可提出假设”与“可完成验证”之间仍存在明显鸿沟。
下面将以生物与生命科学领域为例,进一步概述AI在数据集、基准测试、基础模型与智能体系统等方面的最新进展。
在生物与生命科学领域,人工智能的应用正从生物医学向更广泛的基础生物学研究拓展,涵盖基因组学、神经科学、生态学及合成生物学等多个分支。
2025年,生物训练数据的规模持续扩大,基于基因组与进化数据训练的基础模型已从单纯的预测任务延伸至生成式设计。然而,尽管基因组序列数据已极为丰富,但用于衡量生物系统对干预措施响应情况的功能扰动数据仍十分稀缺,二者之间的差距构成了当前AI生物学研究的关键瓶颈。
在宏观尺度上,计算机视觉与声学模型已被常规化地用于处理传感器数据,以追踪物种种群动态并实时优化农业用水,标志着AI技术已渗透至生态监测与资源管理场景。但生态学与生物多样性领域的AI应用整体滞后于其他生物学分支,其原因在于训练数据稀疏、偏向已被充分研究的分类群,且缺乏标准化的数据格式。在物种分类与进化生物学领域,以BioCLIP系列为代表的视觉基础模型正推动跨物种的分类与发现工作,而PhyloNN等方法则可在无标注数据条件下从图像中识别进化特征。在神经科学领域,AI兼具实用工具与理论启发的双重角色。计算机视觉方法已被广泛应用于模式生物(如果蝇与小鼠)的全连接组数据组装,成为脑图谱绘制的重要技术支撑。与此同时,生物神经元网络与人工深度网络之间的比较研究,正为研究者理解大脑信息处理的基本原理提供新的视角。
表1-4整理了2025年度在该领域发布或应用的重要数据集、基准测试、基础模型与AI智能体,涵盖机构来源、规模及核心特点等信息。
1.数据集
OpenGenome2收录了来自生命所有界域、经过整理的近9.3万亿个碱基对DNA,是迄今构建的规模最大的基因组训练语料库,也是Evo 2模型的基础。在神经科学领域,Spacetop为认知神经科学研究提供了来自101名参与者、总计超过600小时的成像数据。这些资源为基础模型在无需特定任务训练的情况下学习生物学特征提供了必要的数据规模,但基因组数据的可获得性与功能扰动数据之间仍然存在明显差距。
表1 2025年发布/应用的生物与生命科学领域数据集列表
2.基准测试
生命科学领域的基准测试已转向考察工作流程执行能力和工具集成分析能力,而不再只是静态知识测试。BixBench报告显示,前沿模型在真实世界生物信息学分析任务上的准确率大约为17%,这凸显出它们在工具链衔接、文件处理以及领域解释方面仍面临挑战。BioML-bench 则首次对AI智能体在生物医学机器学习任务中的端到端表现进行了评估,这些任务涵盖从蛋白质工程到药物发现等多个环节。研究发现,智能体整体平均表现低于人类基线,也就是AI系统在孤立的子任务上表现较好,但一旦需要执行真实生物研究所要求的多步骤工作流程时,仍然表现不足。
表2 2025年发布/应用的生物与生命科学领域基准列表

3.基础模型
2025年生物与生命科学领域发布的基础模型在基因组学和细胞建模方向上进一步扩展。基因组基础模型 Evo 2 基于 OpenGenome2 进行训练,使用了来自生命所有界域的9.3万亿个DNA碱基对。该模型参数规模最高可达400亿,上下文窗口长度达到100万个 token,并以完全开放权重的形式发布。在神经科学领域,一种神经活动基础模型能够预测神经元响应,并可在不同刺激类型和不同个体动物之间实现泛化。
表3 2025年发布/应用的生物与生命科学领域基础模型列表
4.AI智能体
生命科学领域中的智能体系统正开始将复杂科研工作流程转化为可操作的自动化过程,包括文献综合分析和生物信息学执行。BCI-Agent 能够在无需特定任务训练的情况下,根据电生理记录自主完成神经元细胞类型分类。Biomni 则是一个覆盖25个子领域的通用型生物医学智能体。
表4 2025年发布/应用的生物与生命科学领域AI智能体列表
——本条编译内容为国家农业图书馆 学科咨询服务部《农业科技快讯》工作成果。