bulk RNA-Seq (6)数据挖掘的准备

36 阅读1分钟

我们做完了上游的基础分析之后,接下来就是数据挖掘了。我们先准备数据挖掘的三张表。

表达矩阵(gene_exp)

每一行是一个基因,每一列是一个样本,需要对数据进行标准化。 标准化之前的read count 矩阵,用于差异表达分析
标准化之后的TPM/FPKM 矩阵,用于其他分析(PCA分析、聚类分析等等)

image.png

样本信息表(sample_info) 每一行是一个样本,每一列是一个表型特征(光照、地上生物量、茎长等等),可以和基因进行关联分析

image.png

基因信息表: 每一行是一个基因,每一列是该基因的信息(symbol、KO、GO),基因的信息可以通过eggnog-mapper在线网站注释得到。

image.png

准备好这三张表之后,我们就可以去画图啦,下期见。