Plant Com | 湖南农业大学青年教师张征联合湖南大学于峰团队突破传统RLK分类,在结构与深度学习视角下绘制植物RLK家族的全新分类图谱
2026年2月24日,湖南农业大学张征与湖南大学于峰团队在Plant Communications在线发表题为metaRLK 2.0: an updated database of plant receptor-like kinases developed with structure- and deep learning-based functional annotation and classification的研究论文。该研究构建数据库metaRLK 2.0 (http://www.metaRLK.com),以结构信息与深度学习驱动RLK的功能注释与分类体系更新。
受体样激酶(RLKs)是植物中最大的受体家族。于峰课题组前期建立了RLK数据库metaRLK,metaRLK包括了528个植物基因组中超过520,000个受体激酶和类受体胞质激酶序列。metaRLK基于序列方法将311,581个RLKs划分为21个家族(DOI: 10.1016/j.molp.2024.02.015)。然而,metaRLK基于的序列比对方法存在一定局限:蛋白质进化过程中序列分化速度往往快于结构。在metaRLK数据库中,尚有13%(40,357个)的RLKs无法分类,限制了对RLK的鉴定、分类和功能注释。本论文构建的metaRLK 2.0通过结构注释、折叠分类与深度学习实现RLK分类体系重大拓展。
基于RLK胞外结构域(ECD)的结构信息,鉴定677个RLK结构域,467个为结构方法独有,与序列方法比较增幅达62.7%。序列与结构比对在LRR、Malectin等保守域上高度一致;同时,结构方法在低序列相似、高结构保守域识别上优势显著。如β-螺旋桨结构域序列同源性仅11%,传统方法常将其归为单一RCC1类或遗漏,而结构比对可分辨10余种亚型,揭示隐藏多样性(图1)。
发现RLK-ECD富含刚性β-折叠架构(16种),挑战α/β折叠主导的传统认知,反映植物对细胞壁环境的适应性进化(图2)。这些刚性结构可能更适合在细胞壁主导的复杂胞外环境中实现稳定的多价配体识别,反映了植物固着生活方式的适应性进化。
结合网络拓扑与ProtNLM功能推断,使25,044个未分类RLK明确了家族归类,未明确家族分类的成员占比从13%降至4.9%,RLK家族数由21个扩至91个(含70个新家族),其中50个与细胞壁过程密切相关。
湖南农业大学植物保护学院青年教师张征和本科生李星哲为论文共同第一作者,湖南大学隆平农学院傅萍博士后和于峰教授为论文通讯作者。本研究得到国家自然科学基金、国家重点研发计划和湖南省科技创新计划等项目的支持。