全球渔业与水产养殖业正处于数字化转型的关键节点。在2023年至2025年间,人工智能(AI)在渔业领域的应用研究经历了从单一任务的判别式模型(Discriminative Models)向多模态、生成式(Generative AI)和代理式(Agentic)系统的根本性跨越。传统的计算机视觉(CV)和机器学习(ML)技术虽然在特定场景下实现了自动化,但在处理复杂的生物交互、非结构化数据以及跨领域知识推理方面仍存在局限。随着大语言模型(LLM)、视觉-语言模型(VLM)以及检索增强生成(RAG)技术的引入,渔业AI研究进入了“认知智能”的新阶段。
1. 引言:水域智能化的技术奇点
过去十年,人工智能在渔业中的应用主要集中在基于卷积神经网络(CNN)的鱼类识别和基于循环神经网络(RNN)的水质预测上。然而,自2023年起,随着Transformer架构的普及和基础模型(Foundation Models)的崛起,渔业科研领域迎来了一个技术奇点。
这一时期的研究特征表现为:
- 「从感知到认知的跃迁」:AI不再仅仅是“看见”鱼(识别与计数),而是开始“理解”水下场景(行为分析、语义描述)并“思考”解决方案(疾病诊断推理、养殖策略生成)。
- 「生成式AI的爆发」:大语言模型(LLM)被引入渔业,用于处理海量的非结构化文本数据(如渔民日志、科研文献),并构建具备专业知识的问答系统。
- 「边缘计算与多模态融合」:为了应对海洋环境的通信延迟,轻量化模型被部署在边缘端,同时视觉、声学、环境DNA(eDNA)等多模态数据的融合成为主流。
2. 大语言模型(LLM)与生成式AI在渔业中的颠覆性应用
大语言模型在自然语言处理领域的成功,激发了渔业科研人员将其应用于解决行业特有的“知识碎片化”和“数据异构性”问题。2024年至2025年,多个针对水产领域的垂直领域大模型相继问世,标志着“渔业GPT”时代的到来。
2.1 渔业垂直领域基础模型(Domain-Specific Foundation Models)
通用大模型(如GPT-4)虽然具备广泛的知识,但在处理渔业特定问题时(如特定鱼种的饲料转化率、罕见鱼病的病理特征)往往缺乏精度,甚至产生“幻觉”。因此,构建基于渔业语料库微调的专用模型成为研究热点。
2.1.1 AQUA:首个水产养殖专用大语言模型
2025年7月,研究人员发布了名为 「AQUA」 的水产养殖专用大语言模型,这是该领域的一个里程碑式工作 。
- 「研发背景与挑战」:水产养殖面临着疾病爆发频繁、饲料浪费严重以及高度依赖人工经验等痛点。现有的机器学习方法难以处理领域内复杂的因果关系,而通用LLM缺乏专业深度。
- 「语料库构建」:AQUA的训练基于一个精心策划的领域语料库,包含 「55,105」 份文档,涵盖了开放获取的期刊论文、技术手册及网络抓取数据 。
- 「AQUADAPT框架」:为了解决训练数据稀缺的问题,研究团队开发了 「AQUADAPT」(数据获取、处理与微调)代理框架。该框架结合了专家知识图谱与自动化评估技术,能够生成高质量的合成数据(Synthetic Data),从而扩充训练集并强化模型的逻辑推理能力 。
- 「应用价值」:AQUA被设计为一个全能的咨询系统,能够为养殖户、研究人员及行业从业者提供关于疾病防控、水质调控及孵化管理的精确建议。它不仅是一个问答机器人,更是连接科研成果与生产实践的桥梁,有望解决美国及全球水产养殖业中劳动力成本高昂(占生产成本40-50%)的结构性问题 。
2.1.2 FishLLM:多模态理解与语义推理
如果说AQUA侧重于文本知识,那么2024年发布的 「FishLLM」 则解决了水下视觉的语义理解问题 。
- 「技术突破」:传统的深度学习模型(如YOLO, ResNet)只能输出分类标签(“这是金枪鱼”)和位置框,无法解释“为什么”或描述鱼的状态。FishLLM 基于轻量级的 「TinyLLavA」 架构,是一个多模态大语言模型(MLLM)。
- 「指令微调(Instruction Tuning)」:研究者基于大规模的 「FishNet」 数据集,创建了一套包含分类和检测任务的“指令对话”数据集。这些对话将鱼类的分类学特征(如鳍的形状、体色模式)与视觉特征对齐,并将位置描述映射到图像坐标 。
- 「推理能力」:FishLLM 能够同时执行分类和检测任务,并具备极强的泛化能力。它能够回答诸如“描述图中鱼类的健康状况”或“分析该鱼类所处的生境特征”等复杂问题。这种受人类视觉认知启发的架构,显著提升了模型在面对未知水下场景时的鲁棒性,为生物多样性保护提供了强有力的工具 。
2.1.3 OceanGPT:海洋科学的通用智能体
「OceanGPT」(2024)是另一个针对海洋科学领域的开源大语言模型,其视野更为宏大,涵盖了物理海洋学、海洋生物学及海洋工程 。
- 「DoInstruct 框架」:为了解决海洋领域指令数据匮乏的问题,OceanGPT 引入了 「DoInstruct」 框架。该框架利用多智能体协作(Multi-agent Collaboration)自动生成海量的海洋领域指令数据,涵盖了文献综述、实验协议生成及数据分析代码编写等任务 。
- 「具身智能(Embodied AI)潜力」:OceanGPT 不仅是一个知识库,还展现了初步的具身智能能力。研究表明,它可以理解高层自然语言指令(如“规划一条避开赤潮区域的巡航路线”),并将其转化为自主水下航行器(AUV)的控制代码。这种 「视觉-语言-动作(Vision-Language-Action, VLA)」 的范式,正在重塑海洋探测机器人的交互方式 。
2.2 检索增强生成(RAG)与决策代理
为了克服大模型的“幻觉”问题,2025年的研究主要集中在 「检索增强生成(RAG)」 技术上,即让模型在回答问题前先从外部知识库中检索可靠信息。
2.2.1 RAG-LLM + DQN 的自主养殖控制系统
一项发表于2025年的研究提出了一种结合 RAG-LLM 与 深度Q网络(Deep Q-Network, DQN)的混合架构,用于实现完全自主的鱼类养殖控制 。
- 「感知层」:利用基于 ESP-32 的物联网传感器实时监测溶解氧(DO)、pH值、氨氮及浊度。
- 「认知层(RAG-LLM)」:将传感器数据转化为文本提示(Prompt),输入到 RAG-LLM 系统中。该系统连接到一个包含专家问答对和历史传感器数据的向量数据库,检索并生成基于专家经验的建议(如“当前氨氮过高,建议开启增氧机并减少投喂”)。
- 「决策层(DQN)」:DQN 作为强化学习代理,根据环境状态生成具体的控制策略(如阀门开关、电机转速)。
- 「集成决策」:系统采用“多数投票”机制融合 LLM 的建议与 DQN 的策略,以确保决策的安全性与最优性。
- 「实验结果」:该混合系统在实验中展现了超越人类专家的性能。与传统专家管理相比,「鱼类生长率提高了1.8%」,且「错误率极低(约2%)」。LLM 的预训练知识有效地加速了强化学习代理的收敛速度,避免了RL在初期探索阶段可能导致的灾难性决策 。
2.2.2 渔民报告的自动化数据提取
在渔业管理中,大量数据存在于非结构化的渔民日志和口述报告中。2024年的一项研究利用 「Merak-7B」 模型,实现了对这些叙述性报告的自动化结构化提取 。
- 「技术路径」:研究者首先利用 Claude AI 生成模拟渔民报告的叙述性文本(由于真实数据敏感性),然后训练 Merak-7B 进行关键信息(捕捞量、地点、物种)的提取。
- 「成效」:Merak-7B 在提取关键数据点方面达到了 「91% 的准确率」,证明了LLM在处理低技术素养群体产生的数据方面的巨大潜力,为渔业大数据的补充提供了低成本方案 。
2.3 生成式AI应用总结
| 「模型/系统名称」 | 「发表年份」 | 「核心技术」 | 「主要应用场景」 | 「关键创新点与成效」 |
|---|
| 「AQUA」 | | | | 首个水产专用LLM;解决数据稀缺问题;基于5.5万文档训练 |
| 「FishLLM」 | | Multimodal LLM (TinyLLavA) | | 多模态指令微调;具备图像推理能力;超越传统CV模型泛化性 |
| 「OceanGPT」 | | | | 多智能体生成指令;具备具身智能潜力;发布OceanBench基准 |
| 「RAG-LLM + DQN」 | | | | 神经符号AI融合;生长率提升1.8%;加速RL策略收敛 |
| 「Merak-7B」 | | | | 91%提取准确率;有效处理叙述性文本;低资源部署可行性 |
3. 精准水产养殖(Precision Aquaculture):迈向AIoT融合生态
除了生成式AI的前沿探索,2023-2025年间,精准水产养殖领域的研究更加侧重于 「AIoT(人工智能物联网)」 的深度融合。研究焦点从单纯的监测转向了基于数据驱动的闭环控制和复杂环境下的鲁棒性感知。
3.1 复杂环境下的生物量估计与表型分析
在水下混浊、遮挡严重的真实养殖环境中,准确估计鱼群的生物量(重量、尺寸)一直是行业难题。近三年的研究通过引入先进的计算机视觉技术和几何深度学习,取得了显著突破。
3.1.1 遮挡处理与特征填补框架
2025年6月发表在《Fishes》期刊上的一项研究提出了一种结合 「自动编码器(Autoencoder)」 与回归模型的鲁棒框架,专门解决鱼体遮挡导致的特征缺失问题 。
- 「问题」:在高密度养殖池中,立体视觉(Stereo Vision)系统常因鱼体相互遮挡而无法提取完整的形态特征,导致估算误差大。
- 「方法」:该框架首先利用自动编码器对缺失的形态特征进行重构(Imputation),然后再输入到支持向量回归(SVR)或多层感知机(MLP)中进行体重预测。
- 「结果」:实验表明,该方法将体重估计的均方根误差(RMSE)从传统的 「21.10g 降低至 6.53g」,极大地提升了自动化分级和收获预估的精度 。
3.1.2 实时双目立体视觉与YOLO结合
2024年,Zhang等人提出了一种针对斑点鱼类的实时生物量估计系统 。该系统集成了 「YOLOv5」 目标检测算法与 「双目立体视觉」 技术。
- 「流程」:通过非锐化掩蔽(Unsharp Masking)和直方图均衡化增强视频质量,利用YOLOv5实时检测鱼体,结合双目视差计算深度和尺寸,进而推算体重。
- 「精度」:在自由游动状态下,该系统的平均相对误差仅为 「2.87%」,证明了轻量化模型在边缘端实现高精度测量的可行性 。
3.2 疾病检测:从静态图像到时空行为分析
疾病是水产养殖最大的风险来源。AI在疾病检测方面的应用正从基于体表病灶的静态识别,转向基于异常行为的时空分析。
3.2.1 视觉Transformer(ViT)的应用
尽管卷积神经网络(CNN)是图像识别的主流,但2024-2025年的研究开始采用 「视觉Transformer(ViT)」,因其在捕获全局上下文信息(如鱼体整体姿态扭曲)方面优于CNN。
- 「混合模型架构」:在2024年国际计算机与信息技术会议(ICCIT)上发表的一项研究展示了一种 「ViT + ResNet50」 的混合模型。ViT负责提取全局特征,CNN提取局部纹理特征。
- 「性能」:该模型在包含7类疾病的2450张图像数据集上,对细菌性疾病的检测精度达到了 「100%」,F1分数高达99.10%,展现了深度学习在病害早期预警中的巨大潜力 。
3.2.2 基于行为的早期预警
除了视觉表型,鱼类的异常行为(如食欲减退、游动失衡、聚集异常)往往是疾病的早期信号。
- 「3D轨迹追踪」:利用 「Deep SORT」 和 「高斯混合模型」 对鱼群进行个体追踪,分析其速度、加速度和转弯频率。一旦这些指标偏离正常基准,系统即发出预警。这种方法能够在肉眼可见的病灶出现前数天发现问题,为干预争取宝贵时间 。
3.3 智能水质预测与环境调控
水质预测已从单一的时间序列回归发展为时空融合的深度预测。
- 「深度时空模型」:「LSTM」(长短期记忆网络)和 「GRU」(门控循环单元)已成为标准配置。2025年的综述指出,混合架构如 「CNN-LSTM-GRU」 被广泛用于捕捉传感器数据的空间相关性(如不同深度传感器的关联)和时间依赖性,能有效预测溶解氧骤降和赤潮爆发 。
- 「数字孪生(Digital Twin)」:基于AIoT数据构建的虚拟养殖场(数字孪生体)允许管理者在虚拟环境中模拟投喂策略或增氧方案,观察其对水质和鱼类生长的预期影响,从而优化实际操作。这种“模拟-优化-执行”的闭环正在成为现代化养殖场的标配 。
3.4 智能投喂系统
投喂成本占养殖总成本的60%以上。AI智能投喂旨在通过精准识别鱼类的摄食欲望(Appetite)来优化饲料系数(FCR)。
- 「声画融合」:最先进的系统不再仅依赖视觉(看鱼争抢饲料),而是融合了声学传感器(听鱼吞食饲料的声音)。利用 「ResNet」 分析水面图像,结合声学信号分析,系统能够实时判断鱼群是否“吃饱”,从而自动停止投喂。商业化案例(如eFishery, Aquabyte)显示,这类系统可降低 「15-30%」 的饲料成本 。
4. 远洋渔业与海洋资源管理:从监测到治理
在野生捕捞领域,AI的应用重心在于利用卫星遥感、声呐探测及电子监控技术,解决非法捕捞(IUU)、兼捕(Bycatch)以及渔业资源评估等全球性难题。
4.1 打击IUU捕捞:多源卫星数据融合
非法、不报告和不管制(IUU)的捕捞活动是海洋资源枯竭的主要推手。2023-2025年,“暗船检测”(Dark Vessel Detection)技术趋于成熟。
- 「技术原理」:IUU船只通常会关闭自动识别系统(AIS)。AI系统通过融合多种卫星数据来锁定这些目标:
- 「合成孔径雷达(SAR)」:不受云雾和昼夜影响,能探测到金属船体的强反射信号。
- 「可见光红外成像辐射仪(VIIRS)」:捕捉夜间集鱼灯的亮光。
- 「深度学习模型」:利用 「U-Net」 或定制的CNN模型对SAR图像进行语义分割,提取船只特征,并与AIS轨迹进行比对。如果雷达发现了船只但AIS没有信号,系统即判定为“暗船” 。
- 「实战应用」:「xView3」 挑战赛推动了该技术的发展,Allen人工智能研究所(AI2)和Skylight开发的算法已在加拉帕戈斯群岛等敏感海域部署,实时监控全球数百万平方公里的海域 。
4.2 电子监控(EM)与兼捕减少
电子监控是指在渔船上安装摄像头记录捕捞过程。面对海量的视频数据,AI成为唯一的处理手段。
- 「自动化物种识别」:法国生物多样性局(OFB)在比斯开湾开展的试点项目中,利用计算机视觉技术自动检测刺网渔船的兼捕物种(如海豚、海鸟)。
- 「规模化部署」:该项目从2021年的5艘船扩展至2025年计划覆盖100艘船,产生超过26,000小时的视频。AI模型不仅能识别受保护物种,还能自动模糊船员面部以符合GDPR隐私法规 。
- 「政策推动」:随着AI分析精度的提升,越来越多的区域渔业管理组织(RFMO)开始考虑用AI辅助的EM系统替代人工观察员,以降低成本并提高数据的真实性 。
4.3 渔业资源评估与声学AI
传统的声学评估依赖专家人工分析回声图(Echogram),耗时且主观。
- 「声学深度学习」:最新的研究利用CNN对多频声呐数据进行分析,能够自动区分不同鱼种(如鲭鱼与鲱鱼)并估算鱼群密度。
- 「众包科学」:2025年的 「M-Catch」 软件更新集成了自采样功能,允许商业渔船收集高质量的生物学数据(长度、重量),并通过AI算法将其转化为种群评估所需的年龄结构数据。这种“渔船即科考船”的模式极大地扩充了数据来源 。
- 「环境DNA(eDNA)」:结合机器学习模型分析水样中的eDNA序列,可以推断出该海域的生物多样性构成,成为声学和拖网调查的重要补充 。
5. 挑战与未来展望
尽管进展喜人,但渔业AI的广泛落地仍面临严峻挑战。
5.1 核心挑战
- 「数据稀缺与标注困难」:水下环境数据采集成本高,且高质量的标注数据(特别是珍稀鱼病、特定行为)极度匮乏。AQUA模型使用的合成数据生成技术是一个方向,但仍需真实数据的验证 。
- 「模型的鲁棒性与泛化性」:实验室环境下的高精度模型往往在真实海洋环境中(光照变化、浑浊、生物附着)表现下降。FishLLM的多模态方法试图通过引入语义理解来提高泛化性,但对算力要求较高 。
- 「可解释性与信任度」:对于渔民和监管者而言,AI系统的决策过程往往是“黑箱”。RAG技术的引入虽然提供了依据,但在高风险决策(如疾病用药、禁渔区划定)中,如何量化模型的不确定性仍是难题 。
5.2 未来方向(2026+)
- 「具身智能与作业机器人」:预计大语言模型将深度集成到水下机器人中,使其具备理解自然语言指令并自主执行复杂作业(如网箱修补、死鱼清理)的能力。
- 「海洋全域数字孪生」:结合卫星、浮标、渔船及eDNA数据,构建高精度的海洋生态数字孪生,实现对渔业资源的动态、精细化管理。
- 「边缘端大模型(Edge LLM)」:随着芯片技术的发展,能够在船载终端离线运行的小型化大模型(SLM)将普及,为远洋渔船提供实时的故障诊断和辅助决策支持。
6. 结语
2023年至2025年,人工智能在渔业领域的应用完成了从“感知”到“认知”的蜕变。「AQUA」、「FishLLM」 等专用大模型的问世,证明了AI不仅能处理视觉信号,更能理解复杂的生物学逻辑和专家知识。在精准养殖领域,「RAG-LLM」 与 「深度强化学习」 的结合为实现真正的无人化养殖场指明了方向;在远洋渔业,「多源卫星融合」 技术正在编织一张让非法捕捞无处遁形的天网。
未来,随着合成数据技术的成熟和边缘算力的提升,AI将不再是昂贵的科研工具,而是成为每一位渔民和管理者手中的基本生产力,推动全球渔业向着更加智能、高效和可持续的方向发展。
主要参考文献列表(精选)
「大语言模型与生成式AI」
- AQUA: A Large Language Model for Aquaculture & Fisheries. arXiv, 2025.
- FishLLM: A Unified Framework for Fish Classification and Detection. SSRN, 2024.
- OceanGPT: A Large Language Model for Ocean Science Tasks. ACL Proceedings, 2024.
- Integrating Retrieval-Augmented Generation Large Language Model with Deep Q-Network for Autonomous Aquaculture. PMC, 2025.
- Revolution of AI in Aquaculture and Fish Processing: LLM in Data Extraction. ResearchGate, 2024.
「精准养殖与AIoT」
- AIoT Advances in Aquaculture: A Systematic Review (2012–2024). MDPI Processes, 2025.
- Robust Framework for Fish Biomass Estimation with Feature Imputation. Fishes, 2025.
- Towards Fish Disease Detection using Vision Transformer Model and CNN. IEEE ICCIT, 2024.
- Smart Aquaculture Monitoring System with Automated Fish Disease Identification. Applied Chemical Engineering, 2025.
「远洋渔业与IUU监管」
- Dark Vessel Detection using Satellite SAR and AI. Skylight/MDA Reports, 2024.
- Electronic Monitoring and AI for Bycatch Detection in Bay of Biscay. ICES Library, 2025.
- Application of artificial intelligence in fish information identification: a scientometric perspective. Frontiers in Marine Science, 2025.