生信分析+GEO公共数据:从零到天花板的全攻略!
发布时间:2025-06-27 12:39 浏览量:1
今天和大家分享的是 影响因子 5.7 发表在 Biology direct 杂志上的文章“ Integrative genomics unveils basement membrane-related diagnostic markers and therapeutic targets in esophageal squamous cell carcinoma ” , 这篇文章通过 生物信息学和单细胞测序方法 ,初步探讨 基底膜 在 食管鳞状细胞癌 中的作用和机制,发 现了一些与免疫细胞和免疫功能显著相关的 基底膜 相关基因,如 BGN 、 COL4A1 、 SPARC 和 LUM 。以期为食管 鳞状细胞癌的早期诊断和靶向治疗提供新的策略。
研究亮点 :
1、 基于单细胞测序和多组学分析,挖掘食管鳞状细胞癌( ESCC )中基底膜相关基因( BMRGs )的诊断价值,筛选出 7 个关键基因( BGN 、 LAMB3 、 SPARC 、 MMP1 、 LUM 、 COL4A1 、 NELL2 )并构建诊断列线图。
2、 探究 BMRGs 与肿瘤微环境免疫浸润的关联,发现其与巨噬细胞、 T 细胞等免疫细胞及免疫检查点基因的表达相关性,揭示 ESCC 免疫调控机制。
3、 验证 BGN 基因在 ESCC 中的功能,证实其可通过影响上皮 - 间充质转化促进肿瘤增殖、迁移,并预测 BGN 高表达患者对多西他赛等化疗药物的敏感性,为靶向治疗提供新方向。
一、研究背景
ESCC 是全球高发的消化道恶性肿瘤,尤其在中国发病率居高不下。由于早期症状不明显,诊断困难,多数患者确诊时已处于晚期,预后较差。肿瘤的侵袭与转移是影响预后的关键因素,其过程中常伴随基底膜( BM )的破坏。 BM 是细胞外基质的重要组成部分,其中的层粘连蛋白和 IV 型胶原蛋白等结构蛋白在肿瘤微环境中调节细胞粘附、极性和迁移。 BMRGs 的异常表达可能是肿瘤侵袭的重要标志物,但目前在 ESCC 中的研究较少。因此,本研究通过多组学数据分析,筛选与 BM 相关的诊断标志物,并探讨其在 ESCC 中的潜在机制。
二、研究目的:
研究旨在通过整合单细胞测序与多组学数据,筛选 ESCC 中 BMRGs ,构建诊断模型并验证其临床价值,同时探究 BMRGs 与肿瘤微环境免疫浸润及上皮 - 间充质转化的关联,以挖掘 ESCC 的诊断标志物与治疗靶点。
三、 研究方法
1 、数据获取
从 GEO 数据库获取 4 个微阵列数据集( GSE53625 、 GSE44021 、 GSE23400 、 GSE20347 )和 1 个单细胞 RNA 测序( scRNA-seq )数据集( GSE188900 ),并从 TCGA 数据库获取 81 例 ESCC 样本的 RNA 表达谱数据。
2、 单细胞数据分析
利用 R 包 Seurat 对 scRNA-seq 数据进行过滤、归一化和聚类,通过 UMAP 降维后注释细胞类型;使用 AUCell 和 ssGSEA 算法计算 BM 基因模块评分,借助 Monocle 进行细胞轨迹分析以预测分化状态。
3、 BMRGs 筛选与诊断模型构建
用 limma 包筛选 ESCC 与正常组织的差异表达基因( DEGs ),结合 222 个已知 BMRGs ,通过 LASSO 、 SVM-RFE 和随机森林算法交叉筛选特征基因;基于 7 个关键基因( BGN 、 LAMB3 等)构建诊断列线图,通过 ROC 曲线和 AUC 值验证诊断效能。
4、 功能与通路分析
采用 clusterProfiler 进行 GO 和 KEGG 富集分析(矫正 P
5、 药物敏感性与免疫浸润分析
借助 oncoPredict 包计算药物敏感性评分,比较 BMRGs 高低表达组对多西他赛等化疗药物的反应差异;通过 CIBERSORT 和 MCPcounter 算法评估免疫细胞浸润,分析 BMRGs 与 40 个免疫检查点基因的相关性。
6 、分子亚型与验证
使用 ConsensusClusterPlus 进行无监督共识聚类,将 ESCC 分为 2 个亚型,结合 GSVA 分析亚型间基因集富集差异;通过 Western blot 、 CCK-8 、 Transwell 等实验验证 BGN 基因对 ESCC 细胞增殖、迁移及化疗敏感性的影响。
四、 研究结果
1 、单细胞 RNA 测序数据的分析
对 GSE188900 单细胞数据聚类后,将 ESCC 细胞分为 8 种类型(如 T 细胞、成纤维细胞等)。通过 AUCell 和 ssGSEA 算法计算 BM 基因模块评分,发现 ESCC 细胞的 BM 评分显著高于正常细胞,其中成纤维细胞的 BM 评分最高,提示其在 BM 重塑中起关键作用。
Fig 1 单细胞 RNA-seq 分析表明 ESCC 发生与 BM 之间存在显著相关性
2 、 机器学习筛选核心 BMRGs 并构建诊断模型
从 TCGA 和 GEO 数据集筛选出 22 个 BM 相关差异基因,经 LASSO 、 RF 和 SVM-RFE 算法交叉验证,最终确定 7 个核心基因( BGN 、 COL4A1 、 LAMB3 、 LUM 、 MMP1 、 NELL2 、 SPARC ),其在 ESCC 中显著上调( GSE53625 数据集),单个基因诊断 AUC 均> 0.90 (如 BGN 的 AUC=0.981 )。
基于 7 个核心基因构建的诊断列线图 AUC 达 1.0 ,在 GSE20347 和 GSE23400 数据集验证中, AUC 范围为 0.859~0.986 ,显示高诊断效能。
Fig 2 通过机器学习方法识别 ESCC 的 BM 相关诊断生物标志物
Fig 3 诊断列线图模型的开发和验证
3 、 BMRGs 与肿瘤微环境免疫浸润关联
BGN 、 MMP1 等基因与免疫评分正相关, COL4A1 等与免疫评分负相关; ESCC 组织中 11 种免疫功能评分显著升高,提示免疫应答异常。
CIBERSORT 分析显示, M0/M1 巨噬细胞、 CD4+ 记忆活化 T 细胞与 BM 基因表达正相关,而 Tregs 、 CD8+T 细胞呈负相关; BGN 、 MMP1 与免疫检查点基因(如 CD276 、 CTLA4 )表达显著相关。
Fig 4 ESCC 患者 7 个 BM 基因的肿瘤微环境特征和表达
4 、分子亚型与免疫表型
通过对 ESCC 患者的分子亚型分析,将患者分为亚型 A 和亚型 B ,亚型 B 的 BM 基因表达显著高于亚型 A 。 GSVA 分析显示,亚型 B 富集了细胞外基质解体、胶原代谢、角质形成细胞增殖等途径。免疫微环境评分分析表明,亚型 B 的免疫浸润和基质评分均显著升高,可能预示其更强的侵袭性。
Fig 5 ESCC 中分子亚型的表征及其相关分子特征
5 、成纤维细胞中的基因表达与 EMT 通路活化
在成纤维细胞的伪时间分析中, BGN 、 COL4A1 、 SPARC 和 LUM 基因在不同分化状态下呈现动态变化,揭示了这些基因在成纤维细胞分化与 ESCC 进展中的潜在作用。通过 GSCALite 平台的分析,发现 BGN 与 EMT 通路的激活显著相关,提示其在肿瘤进展中的重要作用。
Fig 6 ESCC 中成纤维细胞的分子表征和功能分析
6 、 BGN 功能验证揭示促癌机制
体外实验显示,敲低 BGN 可抑制 TE-1 细胞增殖、迁移和侵袭,促进细胞凋亡,并下调 EMT 标志物 N-cadherin 、上调 E-cadherin 。
药物敏感性分析表明, BGN 高表达的 ESCC 细胞对多西他赛、紫杉醇等化疗药物更敏感,提示 BGN 可作为化疗敏感性预测标志物。
Fig 7 BGN 敲低对食管鳞状细胞癌细胞表型的影响
Fig 8 BGN 表达及其与 ESCC 药物敏感性的相关性
五 、研究结论
本研究通过整合单细胞 RNA 测序和多组学数据分析,鉴定出 7 个与 ESCC 诊断和进展密切相关的 BM 相关基因( BGN 、 LAMB3 、 SPARC 、 MMP1 、 LUM 、 COL4A1 和 NELL2 ),并构建了具有高诊断效能的列线图模型。功能实验证实, BGN 基因可通过调控上皮 - 间质转化( EMT )促进 ESCC 细胞的增殖、迁移和侵袭,且其表达水平与化疗药物敏感性显著相关。本研究为 ESCC 的早期诊断和个体化治疗提供了新的生物标志物和潜在治疗靶点。