5. Motif分析

226 阅读1分钟

1. motif注释

motif注释一般是对转录因子进行注释,一般不对组蛋白进行motif注释。

  • 序列的特征图: 每个位置有个序列的权重。 image.png

  • 两种方法

image.png

2. 操作

  • 如果是broad peaks
  1. 从peaks文件,提取前1000个,前6行生成bed文件。
# less -SN narrow.peak | sort -k8,8nr | head -n 1000 | awk '{print $1"\t"$2"\t"$3}' # bed3

# less -SN narrow.peak | sort -k8,8nr | head -n 1000 | awk 'BEGIN{OFS="\t"}{print $1,$2,$3}' > head1000_peaksbed  # bed3

less -SN narrow.peak | sort -k8,8nr | head -n 1000 | awk 'BEGIN{OFS="\t"}{print $1,$2,$3,$4,$5,$6}' > head1000_peaks.bed6  # bed6
  1. 从bed文件提取相关序列
bedtools getfasta -fi genome.fa -bed head1000_peaks.bed6 > head1000_peaks.fa
  • 如果是narrow peak
  1. 第二三列改成峰尖前后100bp
less -SN narrow.peak | sort -k8,8nr | head -n 1000 | awk 'BEGIN{OFS="\t"}{print $1,$2+$10-100,$2+$10+100,$4,$5,$6}' > head1000_peaks.bed6  # bed6
  1. 从bed文件提取相关序列(不变)
bedtools getfasta -fi genome.fa -bed head1000_peaks.bed6 > head1000_summit.fa

3. 软件

image.png

image.png

4. 结果

image.png

image.png

5. 保存

image.png

  • Google搜索eps online,有很多在线打开eps的工具

image.png

# 好用的转换eps格式为pdf的在线网页
https://convert.stockphotosecrets.com/