摘要:
目的本研究通过挖掘癌症基因组图谱(the cancer genome atlas,TCGA)数据库和基因表达公共数据库(gene expression omnibus, GEO),鉴定结肠腺癌(colon adenocarcinoma, COAD)中甲基化调控的长链非编码RNA(long non-coding RNA, lncRNA)并判断其预后价值。方法从TCGA数据库下载COAD患者的表达谱数据、DNA甲基化数据以及相应的临床数据。从GEO数据库下载GSE39582队列表达谱数据。使用R 4.0软件,通过"edgeR"和"limma"包筛选差异表达基因并通过Spearman秩次相关判断基因表达值和甲基化值的相关性。使用Cox回归模型构建风险模型。结果通过对TCGA和GEO数据库的联合分析,鉴定出23个甲基化调控的lncRNA。单因素Cox分析鉴定出4个甲基化调控的lncRNA(LINC00675、LINC01082、LINC01207和RP1-170O19.14)与COAD患者的总生存期(overall survival, OS)相关。采用逐步Cox回归分析构建风险模型,风险评分=(-0.148 19×表达量LINC01082)+(-0.120 50×表达量LINC01207)+(-0.120 46×表达量RP1-170O19.14)。结论本研究基于甲基化调控的lncRNA构建COAD患者的风险模型,可以促进对COAD患者OS的个体化预测。