PILER-CR工具

82 阅读2分钟

1、PILER-CR简介
(1)功能
鉴定古细菌和细菌基因组中的CRISPR序列
(2)特定
鉴定速度快,灵敏度高,特异性好,使用简单

2、CRISPR介绍
(1)CRISPR:clustered regularly interspaced palindromic repeats(规律间隔成簇短回文序列)
(2)结构:
CRISPR基因【前导链(leader)+不连续的重复序列(repeats)+长度相似的间隔序列(spacers)】+CRISPR相关蛋白基因(Cas)
(3)定义
leader:富含AT碱基,位于CRISPR基因上游,被认为是CRISPR序列的启动子
repeats:分隔作用,21-40bp,可形成发夹结构
spacers:入侵的病毒序列,20-50bp

3、CRISPR抵御病毒机制
适应阶段:入侵的病毒DNA被Cas蛋白识别并片段化,然后加入CRISPR的spacers区,存储在基因组中
表达和干扰阶段:当病毒再次入侵,spacers区存储的信息发挥作用,与之相同的外源序列被识别捕获,通过有核酸酶活性的Cas蛋白复合物清楚病毒DNA

4、PILER-CR安装
(1)conda安装
创建隔离环境
conda create -n pilercr
激活环境
conda activate pilercr
安装PILER-CR
conda install -c bioconda piler-cr
验证安装
pilercr -h
关闭环境
conda deactivate
(2)NMDC云平台
nmdc.cn

5、输入文件
(1)fasta格式序列
(2)单菌基因组序列
(3)元基因组组装序列

6、PILER-CR运行
pilercr -in <输入序列文件> -out <输出结果文件>

7、查看帮助
pilercr -options

8、PILER-CR参数
-miniarray CRISPR必须包含的最小重复数,默认值3
-minrepeat CRISPR重复序列的最小长度(bp),默认值16
-maxrepeat CRISPR重复序列的最大长度(bp),默认值64
-minspacer CRISPR间隔区的最小长度(bp),默认值8
-maxspacer CRISPR间隔区的最大长度(bp),默认值64

9、示例
conda activate pilercr
pilercr -in my_genome.fasta -minarray 5 -minrepeat 20 -out crispr_report.txt

640

内容学习来源:
[1]nmdc.cn/SProject/vi…
[2]mp.weixin.qq.com/s/DcIdCn4F2…
[3]www.siit.org.cn/content/xia…