note:
现在主流的信息流程搭建软件:snakemake, nextflow;snakemake是基于python的,nextflow基于java,有个公司nf-core开发流程主要用nextflow,显得nextflow比较流行。
1. peaksnake流程【作者写了至少一个多月】
# 取消Snakefile可写权限
chmod a-w Snakefile
1.1 snakemake流程
- 规则
rule叫做规则,比如我制定了3条规则,每条规则有输入输出,有代码,规则之间有依赖关系。
- 上面再制定1条规则叫all:
程序首先会看这条规则,找到最终需要的什么输出文件,然后就去下面找哪个规则能生成这个文件。就运行这个规则,发现这个规则的输入文件来源于上面规则的输出,就去运行上一条规则,就这样运行起来整个程序。
macs3 在call peak的时候,会有一个建模的过程,至少需要检测到1000个peak才能建模。
如果测序太烂了,只检测到500个peak,连模型都建不出来。
本质上应该去解决数据的问题,但也可以使用这个参数:--mfold 默认是5 50,
意思是peak跟背景噪音有5倍-50倍的差异,才会被保留认为是peak。
可以考虑改为2 50,留下更多peak。
snakemake -np 打印提前调试,并不真正跑;
nohup snakemake --core 46 --use-singularity --keep-going &
htop -u zhxd