Cell丨姜长涛/来鲁华/马明/汪锴作开发菌源胆汁酸代谢酶解码模型BEAUT发现新类胆汁酸
发布时间:2025-08-11 13:36 浏览量:2
代谢物多样性与动态转化是人体代谢稳态维持的核心,更是理解与干预疾病进程的重要分子基础和调控靶点。胆汁酸是胆固醇降解途径的主要产物,被称为“新型类固醇激素”,目前已有多种胆汁酸类药物广泛应用于临床。肠道微生物能对胆汁酸进行化学修饰,产生具有不同生物活性的菌源胆汁酸,从而在宿主代谢稳态与失衡中扮演关键角色【1,2】。 深入探究胆汁酸多样性及其生理功能,有助于理解菌源代谢物调控宿主代谢稳态的分子机制与关键靶点;而解析其菌源胆汁酸的合成酶,则是实现靶向菌源胆汁酸代谢、精准调控宿主功能的核心,同时也是针对开发工程菌、特异性调节剂等新型干预策略的基石。
近年来,得益于质谱技术和代谢组学的发展,已发现近千种菌源胆汁酸。然而,相比于代谢物的快速发现,胆汁酸生物合成通路的解析明显滞后。目前,仅有不到10种合成通路得到阐明,包括胆盐水解酶/转移酶(BSH/T)、7-位脱羟基酶系(bai operon)、羟基类固醇脱氢酶(HSDH)和酰化胆酸合成酶(BAS)等【3】。由于传统解析方法往往依赖于对特定菌源胆汁酸的“个例式”研究,即菌源胆汁酸确定→产生菌筛选与合成酶挖掘的自下而上的研究体系,面对数量庞大的菌源胆汁酸,其合成酶的鉴定和发掘仍是领域内的重大难题—例如,阐明肠道微生物介导的胆汁酸7-位脱羟基反应就历时40余年【4】。因此,如何快速高效地解析菌源胆汁酸分子的生物合成通路,是该领域亟待解决的关键科学问题。
2025年8月7日,北京大学医学部基础医学院姜长涛教授、化学与分子工程学院来鲁华教授、药学院马明教授以及基础医学院汪锴研究员团队合作,在Cell杂志发表了题为Identification of gut microbial bile acid metabolic enzymes via an AI-assisted pipeline的研究论文,创新性将“底物口袋相似性”策略用于小样本AI模型构建,开发了胆汁酸代谢酶解码模型BEAUT及其交互式在线平台 (https://beaut.bjmu.edu.cn); 基于BEAUT模型,发现首个具有独特的“双尾素”型结构的新骨架胆汁酸—3-acetoDCA(命名为“双尾素”类胆汁酸)及其合成酶ADS,并阐明其在人群中的广泛分布与关键生理功能。
姜长涛教授团队长期致力于肠道微生物与宿主代谢稳态调控研究。团队在菌源胆汁酸研究领域,通过建立点击代谢组学的新型菌源胆汁酸挖掘系统,发现3-琥珀酰胆酸、色氨酸胆酸等一系列新型菌源胆汁酸。鉴定了3-琥珀酰胆酸合成酶BAS-suc,深入解析了其通过调节NagB促进嗜黏蛋白阿克曼氏菌生长,改善代谢相关脂肪性肝炎(MASH)的独特机制(Cell 2024;Nat Microbiol. 2024)【5,6】;鉴定了色氨酸胆酸的合成酶BST-trp,揭示其宿主受体—孤儿受体MRGPRE,实现了MRGPRE的脱孤,其激活通过β-arrestin1介导的ALDOA磷酸化通路促进GLP-1分泌,改善血糖稳态(Cell 2025a)【7】。上述工作突破了对菌源胆汁酸种类与功能的认知,但菌源胆汁酸合成酶高通量快速挖掘仍存在瓶颈,亟需技术与理论突破。来鲁华教授课题组长期致力于基于物理模型和人工智能(AI)的蛋白质功能、调控和设计等研究,开发了一系列具有前瞻性的生物活性分子设计方法与计算软件,包括基于受体结构的药物设计平台CavityPlus【8】、基于AI的药物设计方法DeepLigBuilder【9】和蛋白功能预测模型 HEAL【10】等。这些工作为通过AI解析未知菌源胆汁酸代谢酶带来了新的可能。
传统的酶学挖掘策略主要是基于特定酶的序列或者结构进行比对发掘同一类反应,缺少针对某类反应底物的不同类型酶的有效挖掘策略。AI可以从大数据中学习并训练模型,发现数据中人类难以辨识的特征,在新的未知数据上做出有效预测。通过AI学习识别胆汁酸代谢酶和非代谢酶特征的方法有望用于菌源胆汁酸代谢酶的挖掘。然而,训练AI模型需要一定数据量,目前已鉴定的胆汁酸代谢酶数量有限(151条)并且大多来源于真核细胞,很难实现模型的有效训练。研究团队通过对胆汁酸代谢酶及非代谢酶的底物口袋相似性分析,发现尽管不同类型胆汁酸代谢酶在序列和结构上存在很大差异,但是它们的底物口袋却高度相似。那么,是否可以利用这一“底物口袋相似性”的原理扩增正样本序列呢?团队通过分析归纳,使用来鲁华教授课题组开发的 Cavity【8】口袋分析平台计算出已知胆汁酸代谢酶的85个不同的底物口袋,通过引入酶底物口袋相似性,在已知胆汁酸代谢丰富的7株肠道菌中进行了胆汁酸代谢酶扩增,最终获得了2472条阳性胆汁酸代谢酶扩增序列。团队利用蛋白质语言模型提取序列中隐藏的蛋白功能特征,建立了菌源胆汁酸代谢酶解码模型BEAUT,解决了小样本情景下的模型训练问题。
进一步,团队利用该模型对人类微生物组计划参考基因组数据集进行了系统挖掘,发现了60余万条潜在的菌源胆汁酸代谢酶,并 构建了人体微生物胆汁酸代谢酶 (HGBME) 的交互式在线平台(https://beaut.bjmu.edu.cn),实现了小样本到大数据的跨越。在菌株水平,团队评估了108株肠道菌对于5种胆汁酸(CA/CDCA/DCA/LCA/3-oxoDCA)的代谢能力,相关性分析发现实验结果与BEAUT的预测结果呈正相关。在蛋白水平,通过在HGBME中随机选择102个酶进行验证,评估对于5种胆汁酸的代谢能力,结果发现有47个酶能够代谢至少一种胆汁酸。
研究团队前期研究发现肠道菌群能够产生一系列3-酰化胆酸,其中一元酰化胆酸是肠FXR强拮抗剂,可有效改善宿主糖脂代谢紊乱,是具有重要潜力的抗代谢性疾病活性分子【6】,但其生理含量的个体差异变化大。团队通过多组学关联分析与底物孵育实验,发现肠道细菌Hungatella hathewayi可以有效降解3-一元酰化胆酸。通过利用BEAUT对H. hathewayi基因组进行胆汁酸代谢酶挖掘及异源表达验证,首次发现了酰化胆酸水解酶MABH,为宿主糖脂代谢紊乱提供了新型潜在干预靶点。
同时,研究团队在分析百酶大规模验证的结果发现,有一类未被报道与胆汁酸代谢相关的酶可以代谢3-oxoDCA,为了探究这类酶的功能,研究团队比较了对照与酶活组的非靶代谢组,发现酶活组出现了一个新型特征峰m/z 433.2957,重要的是,该产物不具有目前已知全部胆汁酸均包含的特征离子—m/z 319.24和337.25【11】,提示发生了碳碳骨架的改变。代谢物结构特征与其生物活性紧密相关。相较于常见的官能团修饰,改变代谢物碳碳骨架的反应相对稀少且类型有限,但此类改变往往能显著影响代谢物活性(例如,微生物对胆固醇的开环代谢能形成具有全新骨架的代谢物,最初被命名为骨化胆固醇,随着其独特生理与病理生理功能的解析,逐渐形成了全新的代谢物类型,即维生素D)。团队对酶反应产物进行了系列基于现代色谱级光谱技术的化合物分离与结构鉴定,发现m/z 433.2957对应的化合物为3-位碳链延伸的新骨架类胆汁酸—3-乙酮脱氧胆酸。3-乙酮脱氧胆酸除了传统胆汁酸特征的17-位侧链“尾巴”外,在3-位也获得了一个独特的乙酮基侧链“尾巴”,我们将这类物质命名为“双尾素”类胆汁酸。目前发现的胆汁酸修饰均发生在羟基、羧基等活性官能团,双尾素类胆汁酸分子由于3-位侧链是通过C-C键连接,其质谱裂解规律与传统的胆汁酸完全不同。随后通过肠道菌株库的系统筛选,研究团队发现多种拟杆菌能够产生3-acetoDCA,其中卵形拟杆菌的产量最高,通过基因敲除实验确认卵形拟杆菌的3-乙酮脱氧胆酸合成酶(BoADS)负责3-acetoDCA的合成,并进一步解析了其催化3-oxoDCA生成3-acetoDCA的酶学反应机制。
对于这种自上而下发现的菌源胆汁酸3-acetoDCA,是否在人体样本中广泛存在并具有生理功能?研究团队通过分析来自美国、欧洲、中国三个不同地区的队列宏基因组数据,发现3-acetoDCA的合成基因Boads在人群中普遍存在。招募30人的队列进行3-acetoDCA含量检测,证实3-acetoDCA在粪便样本中广泛存在。随后研究团队对于3-acetoDCA的生理功能进行了探索,发现其对于传统的胆汁酸受体TGR5、FXR、VDR、PXR没有明显作用,但可以特异性促进Lactobacillus spp.这一大类肠道共生菌生长,并促进吲哚-3乳酸生成,代表了一类介导菌群互作的新模式。
胆汁酸早在十八世纪被分离鉴定,是代谢相关研究中最重要的分子之一,但目前人们对于其合成代谢过程理解还是非常有限。本工作创造性地引入“口袋相似性分析”解决了AI在小样本情景下的应用难题,成功构建了人体微生物菌源胆汁酸解码模型BEAUT,预测了60余万条潜在的菌源胆汁酸代谢酶,实现了超过一万倍的跃升,并搭建了一个 交互式在线平台(https://beaut.bjmu.edu.cn/)供研究者使用。同时,本工作运用BEAUT,首次发现了3-酰化胆酸水解酶MABH,可以作为潜在的糖尿病治疗靶点进一步开发;发现了首个具有独特的双尾素类型结构的新骨架类胆汁酸—3-acetoDCA及其合成酶ADS,其在人体广泛存在并介导菌群的相互作用。本工作解决了胆汁酸代谢酶挖掘这一肠道菌群领域的重要难题,同时本研究开发的代谢酶挖掘框架为未来的众多应用奠定了基础。 该方法可拓展至氨基酸、脂质、多胺、激素等多种重要菌源代谢物的相关酶挖掘,为人体关键代谢物的菌源代谢酶研究建立了新范式。
姜长涛教授、来鲁华教授、马明教授与汪锴研究员为本文的共同通讯作者。北京大学医学部基础医学院副研究员丁勇、博士后罗茜,化学与分子工程学院博士研究生郭家盛、药学院博士 研究生邢佰颖以及化学与 前沿交叉学科研究院博士后林豪禹为本文的共同第一作者。
https://www.cell.com/cell/fulltext/S0092-8674(25)00806-2
姜长涛,北京大学长聘教授、博雅特聘教授,基础医学院副院长,免疫学系主任,国家杰出青年科学基金获得者,科学探索奖获得者。长期聚焦于肠道微生物与宿主代谢稳态调控,形成“肠道菌源酶及代谢物跨界调控宿主稳态”的新理论,以通讯作者(含共同)发表论文50余篇,包括3篇Science、3篇Cell、2篇Nature等研究性论文,其中12篇获Cell、Science等期刊专文述评,13篇入选ESI高被引论文。获中国生命科学十大进展(两度)、中国高等学校十大科技进展、北京市科学技术奖自然科学一等奖、科学探索奖、谈家桢生命科学创新奖及中国青年科技奖等。
iMeta高引fastpPhyloSuiteImageGP2iNAP2ggClusterNet2
iMeta工具 SangerBox2美吉2024OmicStudio WekemoOmicShare
iMeta综述 高脂饮食菌群发酵中药口腔菌群微塑料癌症宿主代谢
10000+:扩增子EasyAmplicon比较基因组JCVI序列分析SeqKit2维恩图EVenn
iMetaOmics高引猪微生物组16S扩增子综述易扩增子(EasyAmplicon)
系列教程:微生物组入门Biostar微生物组宏基因组
专业技能:学术图表高分文章生信宝典不可或缺的人