一、LEfSe
1.简介
LEfSe(LDA Effect Size)是一种用于生物信息学和生物统计学领域的分析工具。
用于寻找不同生物群落中的具有显著生态和统计学意义的差异性微生物特征。
LEfSe的主要功能是将不同生物组群中的微生物特征进行比较,并鉴定哪些特征在不同组群之间的差异最为显著。
LEfSe的核心是线性判别分析(LDA),该方法用于确定哪些微生物特征对于分区不同生物组群最为重要。
2.下载安装LEfSe
下载命令:wget -c ftp://download.nmdc.cn/tools//conda/lefse.tar.gz
创建conda虚拟环境目录:mkdir -p ~/anaconda3/envs/lefse
解压工具包:tar -xvzf lefse.tar.gz -C ~/anaconda3/envs/lefse
启动环境:conda activate lefse
初始化环境:conda unpack
二、Kraken2
1.简介
Kraken 2 是一种用于微生物组分类的计算工具,Kraken 2 旨在加速并提高微生物组学数据的分类和注释。
2.安装
创建conda虚拟环境下目录:mkdir -p ~/anaconda3/envs/kraken2
下载:wget -c ftp://download.nmdc.cn/tools/conda/kraken2.tar.gz
解压工具包:tar -xvzf kraken2.tar.gz -C ~/anaconda3/envs/kraken2
启动环境:conda activate kraken2
初始化环境:conda unpack
验证安装:kraken2 --version
3.数据库安装
下载标准+原生动物+真菌 16GB (PlusPF-16)
mkdir -p ~/database/kraken2/pluspf16g
cd ~/database/kraken2
wget -c https://genome-idx.s3.amazonaws.com/kraken/k2_pluspf_16gb_20230605.tar.gz
tar xvzf ~/db/kraken2/k2_pluspf_16gb_20230605.tar.gz -C ~/database/kraken2/pluspf16g
下载标准+原生动物+真菌 69GB (PlusPF)
v=k2_pluspf_20230605
mkdir -p ~/db/kraken2/pluspf16g
cd ~/db/kraken2
wget -c https://genome-idx.s3.amazonaws.com/kraken/${v}.tar.gz
tar xvzf ~/db/kraken2/${v}.tar.gz -C ~/db/kraken2/pluspf
下载标准+原生动物+真菌+植物完整库 144G (PlusPFP)
指定解压目录,包括时间和类型
v=k2_pluspfp_20230605
mkdir -p ~/db/kraken2/pluspfp
cd ~/db/kraken2
wget -c https://genome-idx.s3.amazonaws.com/kraken/${v}.tar.gz
tar xvzf ${db}/kraken2/${v}.tar.gz -C pluspfp