1.汇报文献:CaKDP: Category-aware Knowledge Distillation and Pruning Framework for Lightweight 3D Object Detection
2.该论文针对激光雷达 3D 检测模型压缩中教师模型能力不足、学生架构设计粗糙、误检冗余三大痛点,基于一阶段与二阶段 3D 检测模型的特性差异,构建了包含三大核心机制的 CaKDP 框架:一是提出学生驱动型类别感知知识蒸馏(CaKD),突破传统同构蒸馏限制,将二阶段高精度教师模型的类别预测知识迁移至一阶段学生模型,通过 NMS 选取学生代表性样本,对齐师生类别预测分布,弥合异构检测器的特征鸿沟,同时缓解前景背景失衡问题;二是设计类别感知结构化剪枝(CaPr),以类别预测差异度作为滤波器重要性评估指标,统一衡量 3D 与 2D 主干网络的滤波器权重,按重要性动态裁剪冗余结构,替代传统等比例剪枝,实现轻量化学生模型的可定制化架构搜索;三是引入改进型 IOU 感知精炼模块,通过新增 IOU 预测头筛选低置信度假阳性样本,仅过滤冗余预测而非重打分,以近乎可忽略的计算开销提升检测精度。实验在 KITTI、Waymo Open Dataset(WOD)两大权威 3D 检测数据集上验证,结果显示:在 KITTI 数据集上,CaKDP 将 SECOND 模型参数压缩 3.1 倍的同时,mAP@R40 提升 5.05%;在 WOD 数据集上,将 CenterPoint 计算量减半,L2 mAPH 提升 1.61%,远超 Vanilla KD、SparseKD、PointDistiller 等主流压缩方法。消融实验证实,CaKD、CaPr、IOU 精炼三大模块协同作用,能在大幅降低模型参数量与计算量的同时,显著提升检测精度。该框架实现了 3D 检测模型高精度与轻量化的平衡,无需新增复杂推理模块,可直接兼容现有一阶段体素式 3D 检测器,为自动驾驶、机器人、VR 等场景的边缘端实时 3D 目标检测提供了高效可行的压缩方案。
1.汇报文献:Pan-Mamba: Effective pan-sharpening with state space model2.本文针对遥感全色锐化任务中全局信息建模效率低、跨模态交互不足、光谱与空间信息融合不精准等问题,提出基于状态空间模型的轻量级网络Pan‑Mamba。该方法以Mamba为核心特征提取单元,凭借线性复杂度与全局感受野,高效捕捉遥感图像长程依赖,解决传统Transformer计算量大、CNN感受野有限的缺陷。同时,设计通道交换Mamba块实现轻量级跨模态浅层交互,降低特征干扰;提出跨模态Mamba块,通过统一门控与深度卷积完成光谱与纹理的精准深层融合。实验在WV2、GF2、WV3等多个标准数据集上开展,降分辨率场景中PSNR、SSIM、SAM等指标全面超越现有方法,全分辨率真实场景下Dλ、Ds、QNR无参考指标同样最优。模型仅0.18M参数,兼具高精度、轻量与高效性,验证了Mamba在遥感图像融合中的优势,可为大尺寸遥感影像处理、农业监测等实际应用提供可靠技术支撑。1.汇报文献:Knowledge assimilation: Implementing knowledge-guided agricultural large language model2.该论文通过构建高质量农业数据集CCAD(含22万条Q&A对及15.8万token的知识库),提出知识引导的农业大模型KALLM,结合知识协调的微调(KCFT)(通过动态调整农业关键词的损失权重,让模型更关注领域专业术语)和主题匹配的自反思RAG(TSRAG)(用主题词检索并经DPR语义相似度+ChatGPT领域过滤,提升证据检索精度),解决了农业领域LLM因数据稀缺、token级监督不足、句子级证据检索困难导致的知识整合问题;实验表明,KALLM在文本生成指标(如手动数据使BLEU从0.980提升至2.205、ROUGE-1从0.212提升至0.893、BertScore从0.587提升至0.676,且相比原生GPT-4全指标平均提升29.37%、相比传统SFT+RAG提升15.97%)和专家评估(3位一线农技专家双盲测试显示,在流畅性、专业性、信息丰富度、可操作性、整体评分等维度均位列第一,整体评分7.7/10)中均优于基线模型,输出符合农业规范,具备直接落地的农事决策指导价值。