重测序GWAS分析之Tassel-Glm模型

83 阅读1分钟

在重测序GWAS中,Tassel是一款经典且广泛使用的生物信息学工具,主要用于处理SNP数据、解析群体遗传结构,并进行关联分析以挖掘与表型相关的候选基因。

图片

Tassel工具背景

Tassel(Trait Analysis by aSSociation, Evolution and Linkage)由美国玉米遗传学与基因组学实验室(Maize Genetics and Genomics Laboratory)  开发,最初用于玉米的遗传分析,后扩展到其他动植物。其核心优势是集成了群体遗传分析(如群体结构、亲缘关系)和关联分析功能。

Tassel的核心功能

  1. 数据格式转换:支持VCF(重测序数据常用)、HapMap、PLINK等格式的导入和转换。
  2. SNP数据预处理:包括过滤低质量SNP(如缺失率、最小等位基因频率MAF)、样本过滤等。
  3. 群体遗传结构分析:通过PCA(主成分分析)评估群体分层(群体结构),生成协变量用于校正GWAS假阳性。
  4. 亲缘关系(Kinship)计算:构建样本间的亲缘关系矩阵,用于控制近交效应。
  5. 关联分析模型:支持多种GWAS模型(如GLM、MLM、FarmCPU等),可根据数据特点选择。