文献解读 | Nature重磅:11000个转录组数据,拆解哺乳动物衰老的通用“时钟“ 📅 2026/6/25 20:23:43 以解牛之法析生信观微雀之形览科研。**乔粒说**今天我们来解读一篇发表在Nature的文献它不仅使用了跨物种、跨组织、跨细胞类型的整合分析框架用统计方法线性混合效应模型弹性网络提取了共性信号。还实现了从整体时钟到模块时钟的方法学突破。WGCNA弹性网络的组合不是新工具但把两者串成模块特异性时钟这条分析链路是具有创新精神的。并且使用多层次验证链路。从bulk RNA-seq → 单细胞 → 蛋白组 → 人体大队列每一步都在独立验证相同的核心基因这是稳健性的最高标准。 文献解读字段内容英文标题Universal transcriptomic hallmarks of mammalian ageing and mortality中文标题哺乳动物衰老与死亡的通用转录组标志物DOI10.1038/s41586-026-10542-3发表时间2026年5月发表期刊Nature影响因子IF50.5这篇文章到底牛在哪先说大白话这篇文章把小鼠、大鼠、猕猴、人四种哺乳动物、超过25个组织、总计11,000多个bulk转录组样本全部整合到一起用机器学习训练出了一个能跨物种预测生物年龄和死亡风险的转录组模型。打个比方你平时买个二手车只能看里程表和外观判断车况。这个研究相当于给细胞装了一个OBD行车电脑——读一下基因表达数据就能估算这台细胞引擎到底跑了多少公里、还能撑多久。发现CDKN1A、LGALS3、GPNMB这三个基因在四种哺乳动物的衰老过程中一致地上调表达是跨物种通用的衰老标签基因衰老相关的转录变化不是散乱的——它们组成了28个功能模块炎症模块、线粒体模块、染色质模块等不同干预手段打的是不同模块热量限制主要修复线粒体模块而慢性炎症主要打击免疫模块——这为精准干预特定通路提供了路线图从生信角度看这篇文章绝不仅仅是样本量大。它的分析框架——多物种荟萃分析 弹性网络机器学习 WGCNA模块拆解 模块特异性时钟——完全可以复用到其他生物学问题上。生信分析流水线拆解分析流程第一步Gompertz死亡风险建模。不是简单地用时序年龄当标签而是用Gompertz模型拟合每条生存曲线计算出每个样本对应的预期对数死亡率——这是一个更精准的标签比几岁更反映真实的生物学状态。第二步归一化年龄。不同物种寿命差距巨大小鼠2年 vs 人类80年直接比较年龄没有意义。作者把每种动物的时序年龄除以该物种的最大寿命99.9百分位得到一个0-1的归一化年龄分数。这一步让跨物种比较成为可能。第三步线性混合效应模型做差异基因筛选。识别与年龄、死亡率、寿命显著相关的基因。这一步筛出了9,000个年龄相关基因和3,000个预期最大寿命相关基因。第四步弹性网络Elastic Net机器学习建模。用弹性网络回归训练了两个核心时钟时序年龄时钟Pearson r0.94, R²0.88死亡率时钟基于YuGene归一化弹性网络是LassoRidge的混合体既能做特征选择又能防止过拟合特别适合这种样本不多但特征超多的转录组数据。第五步WGCNA加权基因共表达网络分析。把11,000个样本的基因表达模式拆成了28个共调控模块然后看每个模块跟年龄、死亡率的相关性。第六步模块特异性时钟。传统时钟只给一个总分作者给每个模块单独训练了一个子时钟。这样做的好处是——你能看到某个干预到底影响了哪个通路。比如热量限制主要降低线粒体模块的时钟年龄但对炎症模块影响不大。LPS注射模拟炎症主要加速免疫模块时钟。这就是精准拆解衰老路径的思路。验证策略多维度交叉验证别以为建完模型就完事了。作者做了六层验证独立数据集验证用训练集之外的独立数据测试时钟预测准确性干预实验验证验证时钟能否区分延长寿命的药物vs缩短寿命的药物跨物种验证在小鼠上训练的时钟直接用到猕猴和人类身上测试单细胞验证48/49种细胞类型都显示tAge与年龄正相关体外实验验证在细胞衰老、辐照、重编程等模型中测试UK Biobank蛋白组验证5万人的血浆蛋白数据验证GPNMB、CDKN1A、LGALS3与全因死亡率的关系这套验证链路堪称生信分析的教科书级操作。研究结果1啮齿类多组织转录组时钟的构建与性能基于 4539 份啮齿类样本训练时序年龄、归一化年龄、预期死亡率三类时钟。时序年龄时钟测试集 r0.958R²0.92性能媲美甲基化时钟留一组织验证中位数 r0.86证明衰老转录组信号具有全身保守性。其中死亡率时钟可同时区分年龄和寿命干预效应实用价值更高。我们自己要做类似的转录组时钟1的完整流程可以直接复刻——数据清洗→Gompertz标签→弹性网络→独立验证。每一步都有现成的R包支持glmnet、lme4、survival。2跨物种保守性与单细胞验证四物种通用时钟 LOFO 验证 r0.952与泛哺乳动物甲基化时钟性能相当留一物种验证可稳定捕捉衰老轨迹证明衰老转录组特征在哺乳动物中高度保守。单细胞层面聚合 25 个以上同类型细胞即可获得可靠年龄预测98% 的细胞类型年龄与 tAge 显著正相关。做单细胞数据图2的思路告诉你怎么把bulk RNA-seq训练出来的时钟迁移到单细胞数据上——用相同的基因列表在scRNA-seq表达矩阵上计算tAge然后按细胞类型分组看差异。3WGCNA模块拆解与Klotho敲除验证通过 WGCNA 鉴定 28 个共表达模块23 个可构建有效独立时钟全部模块组合的性能接近全转录组时钟。不同干预对应不同模块响应LPS 处理后免疫模块 tAge 升高最为明显热量限制主要降低代谢模块 tAgeKlotho 早衰模型以代谢通路加速为主炎症模块无显著变化。WGCNA不是新鲜工具但把WGCNA模块跟机器学习时钟嫁接是本文的创新。操作路径WGCNA分模块 → 每个模块取第一主成分 → 对每个主成分训练弹性网络时钟 → 得到模块特异性tAge。这套流程可以复用到任何如果你想知道XX干预影响了哪个通路的问题。4体外细胞模型的转录组年龄验证人成纤维细胞体外培养过程中 tAge 随时间线性升高hTERT 过表达可消除该趋势iPSC 重编程后 tAge 显著下降与去分化过程匹配。寡霉素、2-DG 等代谢胁迫及 γ 辐照均会升高 tAge且不同损伤类型对应不同的模块变化特征。如果做细胞实验图4给了一个思路——测处理前后的转录组用公开的衰老时钟本文提供了在线工具TACOhttps://app.gladyshevlab.org/TACO/计算tAge变化就能量化干预是否延缓细胞衰老。5疾病模型与人类大队列验证9 种啮齿类慢性病模型中多数 tAge 显著升高肝癌因细胞去分化整体 tAge 降低但炎症、代谢模块仍呈加速状态。FHS 人群队列中转录组死亡率时钟预测全因死亡的性能与二代甲基化时钟相当核心基因的蛋白水平在 UKB 队列中与死亡风险显著相关UK Biobank的蛋白组数据Olink平台是免费的公共资源任何课题组都能申请。可以验证自己的目标基因是否与人类寿命/疾病相关UK Biobank是最佳验证数据集。操作路径申请数据 → 提取目标蛋白 → Cox回归分析 。研究结论这篇研究最终得出以下核心结论哺乳动物存在通用的转录组衰老标志物CDKN1A、LGALS3、GPNMB在四种哺乳动物的25组织中一致随年龄上调是跨物种保守的衰老时钟基因转录组衰老具有模块化架构28个共调控模块可以被拆分为独立的子时钟不同模块对不同干预的响应不同——炎症模块响应LPS代谢模块响应热量限制转录组年龄可以被逆转重编程、异时异种共生、早期胚胎发育都能降低tAge证明转录组衰老是可逆的转录组时钟与DNA甲基化时钟互补两者在人类血液中相关但不重叠转录组更擅长捕捉动态功能状态变化点评乔粒有话说这篇文章最值得学习的地方不是发了Nature而是它的分析框架的可复现性。全文没有用任何奇技淫巧——Gompertz模型是19世纪发明的弹性网络是2005年提出的WGCNA是2008年发表的。但把这些老工具用正确的逻辑串起来就是好思路。这篇能发 Nature核心赢在三个点第一是规模与维度拉满。4 个物种、上万样本、26 种组织从 bulk 到单细胞从细胞模型到在体干预从模式生物到人类队列从衰老加速到年轻化重置验证维度非常完整说服力足够。第二是精准解决领域难点。针对转录组时钟 “精度低、批次效应大、可解释性差” 三个核心问题分别用 “大样本训练 相对表达校正” 解决精度与批次问题用 WGCNA 模块拆解解决可解释性问题每一步都踩在领域需求上。第三是工具化。最后开源网页工具和 R 包降低了使用门槛相当于把方法做成了领域通用工具后续的引用和影响力会持续发酵。本文使用的在线工具本文提供了免费的在线转录组年龄计算工具TACOTranscriptomic Age Calculator Onlinehttps://app.gladyshevlab.org/TACO/R包 tAgeGitHub上可获取用于本地化时钟计算以解牛之法析生信观微雀之形览科研。今天的文献分享就到这里啦欢迎批评指正