MultiQC简介

NGS技术的进步催生了新的实验设计、分析类型和极高通量测序数据的生成。对于这些数据的质量评估，每一步分析结果的评估是后续结果可信度的衡量和保障。不少生信工具都可以给样品生成一个评估结果，如FastQC等许多生信软件。

但是这时又出现了一个难题，那就是几乎所有的质控工具都是针对单个样本生成一个报告，这就要求用户自己去逐一查找各个QC结果，这无疑是个十分耗时、重复又复杂的事，而且还不能快速看出所有样本的异同。

那能否把所有质控结果整合在一起呢？答案是可以的

一个基于Python的小工具：MultiQC，很好地解决了这个繁琐的事情

其强大的功能主要体现在以下三个方面：

能将测序数据的多个QC结果整合成一个HTLM网页交互式报告，同时也能导出pdf文件；
支持多种分析类型的质控结果查看，如：RNAseq、Whole-Genome Seq、Bisulfite Seq、Hi-C和MultiQC_NGI；
支持整合68种软件分析的结果，而且支持的软件还在持续增加

一、 MultiQC的安装

关于MultiQC的安装，可查看MultiQC的官网MultiQC，官网上提供了三种安装方式，如下所示(建议使用第二种)

pip install multiqc    # Install
multiqc .              # Run

conda

conda install -c bioconda -c conda-forge multiqc    # Install
multiqc .                                           # Run

manual

git clone https://github.com/ewels/MultiQC.git
python setup.py install
multiqc .

建议使用第二种conda安装方式

选择conda安装MultiQC的前提是需要先安装Anaconda或Miniconda

Anaconda的安装

Anaconda的安装可参考下面的文章

在Linux中安装Anaconda

安装MultiQC

在已安装Anaconda或Miniconda的linux系统中输入以下命令

conda install -c bioconda -c conda-forge multiqc

按<y>键同意

安装完成

二、 MultiQC的使用

1. 下载SRA序列

在NCBI的SRA数据库挑选几个感兴趣的SRR文件进行下载
挑选了一些小一点的文件，如下

使用prefetch命令下载上述SRR文件（前提要先安装SRA-tools，安装教程可参考SRA-tools的安装）

下载SRA文件的方法有很多，比如aspera等软件，这里以SRA-tools的prefetch命令下载SRR文件为例

prefetch SRR17009175
prefetch SRR15971013
prefetch SRR15971001
prefetch SRR15971005

下载完成之后，将下载的SRA文件复制（cp）或移动（rm）到指定文件夹(SRA)下

2. 解压SRA文件为fastq格式

解压SRA文件有两种方法，分别为逐个解压和批量解压

逐个解压

fastq-dump --gzip --split-files  SRR15971001.sra
fastq-dump --gzip --split-files  SRR15971005.sra
fastq-dump --gzip --split-files  SRR15971013.sra
fastq-dump --gzip --split-files  SRR17009175.sra

这里--gzip参数是为了生成压缩为gz格式的fastq文件，以节省磁盘空间

批量解压

新建脚本文件

vi fqdump.sh

输入以下代码

#!/bin/sh
for i in *sra
do
echo $i
fastq-dump --gzip --split-files $i
done

保存并退出:wq

运行脚本

sh fqdump.sh

这里使用批量解压的方式解压SRA文件

解压后如下图所示

因为是双端测序，所以每个样本有正向和反向两个文件

3. 用FastQC进行数据质量测评

安装FastQC
执行下列命令

fastqc SRR15971001_1.fastq.gz
fastqc SRR15971001_2.fastq.gz
fastqc SRR15971005_1.fastq.gz
fastqc SRR15971005_2.fastq.gz
fastqc SRR15971013_1.fastq.gz
fastqc SRR15971013_2.fastq.gz
fastqc SRR17009175_1.fastq.gz
fastqc SRR17009175_2.fastq.gz

得到fastqc.zip和fastqc.html文件