9. PeakSnake自动化流程跑起来

163 阅读1分钟

note:

现在主流的信息流程搭建软件:snakemake, nextflow;snakemake是基于python的,nextflow基于java,有个公司nf-core开发流程主要用nextflow,显得nextflow比较流行。

1. peaksnake流程【作者写了至少一个多月】

image.png

# 取消Snakefile可写权限
chmod a-w Snakefile

1.1 snakemake流程

  • 规则

image.png

rule叫做规则,比如我制定了3条规则,每条规则有输入输出,有代码,规则之间有依赖关系。

  • 上面再制定1条规则叫all:

image.png

程序首先会看这条规则,找到最终需要的什么输出文件,然后就去下面找哪个规则能生成这个文件。就运行这个规则,发现这个规则的输入文件来源于上面规则的输出,就去运行上一条规则,就这样运行起来整个程序。

image.png

macs3 在call peak的时候,会有一个建模的过程,至少需要检测到1000个peak才能建模。
如果测序太烂了,只检测到500个peak,连模型都建不出来。
本质上应该去解决数据的问题,但也可以使用这个参数:--mfold 默认是5 50,
意思是peak跟背景噪音有5倍-50倍的差异,才会被保留认为是peak。
可以考虑改为2 50,留下更多peak。

snakemake -np 打印提前调试,并不真正跑;

nohup snakemake --core 46 --use-singularity --keep-going &
htop -u zhxd