bulk RNA-Seq （6）数据挖掘的准备我们做完了上游的基础分析之后，接下来就是数据挖掘了。我们先准备数据挖掘的三

我们做完了上游的基础分析之后，接下来就是数据挖掘了。我们先准备数据挖掘的三张表。

表达矩阵（gene_exp）

每一行是一个基因，每一列是一个样本，需要对数据进行标准化。标准化之前的read count 矩阵，用于差异表达分析
标准化之后的TPM/FPKM 矩阵，用于其他分析（PCA分析、聚类分析等等）

样本信息表（sample_info） 每一行是一个样本，每一列是一个表型特征（光照、地上生物量、茎长等等），可以和基因进行关联分析

基因信息表：每一行是一个基因，每一列是该基因的信息（symbol、KO、GO），基因的信息可以通过eggnog-mapper在线网站注释得到。