TCGAplot在线版:输入基因,一键绘制TCGA基因表达与TMB相关性雷达图

284 阅读3分钟

1, TCGAplot 简介

华科同济医院的王雄老师课题组利用TCGA数据库,开发了一个TCGA多组学数据泛癌分析和可视化R包TCGAplot[1]。用于泛癌表达以及基因表达与 TMB、MSI、TIME 和启动子甲基化之间相关性等分析。

2, TMB 简介

肿瘤突变负荷(Tumor Mutation Burden,TMB)是指单位长度中检测到的突变总数。这些突变可以是单核苷酸突变,插入缺失等。

TMB = 体细胞突变数/ 每百万碱基(Mb

一般来说,TMB值越高,意味着肿瘤细胞中的突变数量越多。高TMB的肿瘤通常会产生更多的新抗原,使免疫系统更容易识别和攻击肿瘤细胞。此外,不同肿瘤中,TMB 中位值和分布范围也不同。

3 ,一键在线绘制基因表达与TMB 的相关性雷达图

然而,由于TCGAplot R包安装与使用需要相关专业知识。为了更好地帮助大家挖掘TCGA,经与王老师沟通,我们推出了在线版TCGAplot供大家免费使用。

今天,给大家带来的第4个函数:某个基因的表达与TMB的相关性雷达图。

3.1 打开作图URL

www.bioinformatics.com.cn/plot_tcgapl…

1.png

3.2 填写感兴趣的基因,选择参数并提交

将感兴趣的基因symbol粘贴到输入框,由于基因名会更新(见:坑你没商量的公众号文章),所以提交的基因symbol必需在所提供的genelist里边。例如这里填写基因KLF7,即Kruppel-like factor 7,它是一种转录因子,在生物体内各组织中广泛表达,并参与调控细胞的增殖、分化、再生以及肿瘤发生等重要的生理功能。

我们提供了统计方法,字体等参数供大家选择使用。选择好参数后,点击提交按钮。

2.png

3.3 下载图片及数据

由于需要从上万个样品中调取数据并绘图,约40秒后,会出来雷达图。我们提供了pdf、svg两种矢量图,png、tiff两种标量图供大家下载使用。同时也提供了图片对应的数据供下载。

图片说明:

雷达图中最外圈是33种癌症,按字母顺序顺时针排布。名字上的星号表示显著性水平:*表示p<0.05, **表示p<0.01, ***表示p<0.001, ****表示p<0.0001。这个雷达图包括5个圈,12点位置的刻度是每个圈对应的相关性大小,其中最外圈是0.2,最内圈是-0.4。此图中,距离外圈越近表示正相关越大,距离内圈越近表示负相关性越大。径向的轴对应具体某癌症,以ACC为例,其相关性约为0.2。共33个点连起来围成了一个N边型。这个图的关键在于看准刻度,最大值多少,最小值多少,0点在哪里,有没有星号,N边型的峰和谷对应的都是哪种癌症。

数据说明:

4.png

数据包括4 列:

Caseid:TCGA数据库的ID

Cancer:肿瘤类型

KLF7:该基因的log2(TPM+1)值,由于存储空间及精度原因,这里仅保留了2位小数。

TMB:肿瘤突变负荷

相关性表格:

5.png

数据包括3 列:

Cancer:肿瘤类型

Corr:相关性

Corr(p):显著性

注:这个表格是根据上个表格重新计算的,精度可能跟原图稍有差异,供参考。

3, TMB 计算

使用maftools R包可以计算TMB值。通过运行作者所给的源码即可。

github.com/tjhwangxion…

我们重新算了下发现,新的TMB结果跟TCGAplot github上的示例不太一样,我们以新的为准。

参考文献:

[1] Liao C, Wang X. TCGAplot: an R package for integrative pan-cancer analysis and visualization of TCGA multi-omics data. BMC Bioinformatics. 2023 Dec 17;24(1):483. doi: 10.1186/s12859-023-05615-3. PMID: 38105215; PMCID: PMC10726608

微生信助力高分文章,用户 195000 谷歌学术 3500