IF15.7!! 中国农业科学院仅用 6图,强势发表《Nature 》子刊!!!
耐药菌肆虐无计可施?DLFea4AMPGen 来了!深度学习 + SHAP 解析核心特征,75% 候选肽具双效活性,D1 可破多重耐药菌,为抗菌新药研发辟新径!生信研究社 将带大家拆解一个看似复杂的概念,让你在5分钟内掌握其核心。该研究由西安交大附一院戴 Xiaofeng 团队与贵州医科大学赵 Xing 团队联合完成,系统梳理了 SLE 的核心发病机制、诊断标准、风险因素及防治策略,提出 “免疫过度激活、细胞因子微环境失衡、碎片清除障碍” 三大核心机制,为 SLE 的精准诊疗提供了全面的理论支撑与临床参考。中文标题:DLFea4AMPGen de novo通过整合从深度学习模型中学习到的特征设计抗菌肽发表期刊:Nature communications每天用暖暖的文字和懂你的分析,陪你拆开生活的“盲盒”!等你来抱抱灵感呀~(づ。◕‿‿◕。)づ- 临床痛点:抗生素耐药菌肆虐,传统 AMP 设计成功率低(<30%),且忽略氧化应激引发的炎症损伤
- 生信切入点:深度学习可快速挖掘肽序列 - 活性关联,结合特征提取工具能缩小筛选范围,提升效率
- 本文研究缺口:现有方法虚拟库规模庞大(20¹³ 序列),计算成本高,且缺乏 “多活性整合” 设计思路
- 公共数据库:整合 20 个生物活性肽数据集(含 ABP、AFP 等 18 种活性),共 23,346 条序列
- 自建数据集:临床 /livestock 分离的 10 株耐药菌(如 MRSA 09057、E.coli z44)+ 小鼠脓毒症模型样本
- 模型构建:用 MP-BERT 预训练模型,微调得到抗菌 / 抗真菌 / 抗氧化 3 个预测模型(ABP-MPB 等)
- 特征提取:SHAP 量化氨基酸贡献,滑动窗口(13AA)提取关键特征片段(KFFs),聚类为 4 个亚家族
- 序列筛选:保留模型预测概率 > 0.99、正电荷≥2 的序列,K-means 聚类选代表性肽(每类 4 条,共 16 条)
- 药物预测:Connectivity Map 匹配潜在作用机制,验证与细菌膜破坏相关通路
- 细胞实验:PBMC 细胞毒性检测、红细胞溶血实验,验证肽安全性
- 分子实验:RT-qPCR 检测抗菌相关基因表达,SEM/TEM 观察细菌膜损伤
- 动物实验:小鼠脓毒症模型,检测脏器菌载量 + 炎症因子(TNF-α、IL-6)水平
图中信息:展示 “模型训练→特征提取→序列生成→实验验证” 全链路,通过 SHAP 筛选 3400 个 KFFs,聚类为 4 个亚家族(Fig.1b-d)结论:该流程将虚拟库规模从 1.59×10⁶缩小至 89 万条以内,大幅降低筛选成本,同时保留核心活性特征图中信息:ABP-MPB 等模型在测试集上准确率 86%,优于 SVM/XGBoost;23,346 条序列中 4760 条被预测为 “三活性” 肽(Fig.2c)结论:深度学习模型预测性能碾压传统方法,多活性筛选能富集高价值候选肽,提升验证成功率图中信息:13AA 长度肽占比最高(62%),KFFs 中 Lys/Cys/Trp 等活性氨基酸占比提升 0.14%-4.11%;4 个亚家族有独特氨基酸分布(Fig.3e)结论:明确 AMP 活性核心氨基酸特征,为后续定向设计提供生信依据图中信息:16 条候选肽中 12 条至少具备两种活性,D1 对 MRSA 的 MIC=16μM,溶血率 < 4%;小鼠模型中肝脏菌载量降低 1.02 log CFU/g(Fig.5a-e)结论:DLFea4AMPGen 设计成功率达 75%,候选肽兼具高活性与安全性,可对抗耐药菌- 首次将 SHAP 与聚类分析结合,从 “特征提取→序列生成” 形成闭环,提升 AMP 设计精准度
- 整合三种活性设计,解决细菌感染引发的氧化应激问题,功能更全面
- 生信流程开源(GitHub 可获取代码),数据集涵盖临床耐药菌,易复刻
- 未纳入空间转录组数据,无法解析肽 - 细菌互作的空间特征
- 候选肽仅验证 17 种微生物,对罕见耐药菌的活性需进一步测试
- 改进方向:结合 AlphaFold 预测肽三维结构,用分子对接模拟与细菌膜的结合模式,进一步提升设计效率
- 方向:聚焦 “耐药菌 + 多活性肽设计”,参考 “特征提取→聚类筛选→实验验证” 框架
- 捷径:从 GEO 下载抗菌肽数据集(GSE128480 等),优先选择含 MIC 值的队列
- 基础分析:Python(pandas 处理数据、scikit-learn 计算 AUC)
- 核心工具:MP-BERT(肽序列预测)、SHAP(特征解释)、K-means(聚类筛选)
- 可视化:ggplot2(模型性能图)、PyMOL(肽结构可视化)
- 基础验证:合成候选肽(纯度 > 95%),检测对 E.coli/S.aureus 的抑制率
- 功能验证:ABTS 法测抗氧化活性,CCK-8 检测细胞毒性
- 简化验证:用临床分离的 MRSA 菌株验证 MIC 值,无需复杂动物实验即可发中高分 SCI
你觉得 DLFea4AMPGen 策略中,哪个步骤最能提升设计成功率?如果要设计抗结核杆菌的 AMP,你会优先选择哪些生信工具?欢迎在评论区留言~