1. ChIP-seq与CUT&Tag原理

484 阅读3分钟

1. 全称

  • ChIP-seq: Chromatin Immuno Precipitation
  • CUT&Tag: Cleavage Under Targets & Tagmentation

2. ChIP-seq原理

1.背景

  • 转录速度的快慢:染色质马上打开还是缓慢打开;
  • 转录出来mRNA条数的多少:丰度受到增强子、隔离子、沉默子的影响;

image.png

2.研究

假如,水稻中有转录因子TF1,与水稻耐寒相关 --> 推测梅花中是否有TF1,也与梅花耐寒相关,调控了哪些基因,从而与耐寒相关。 image.png

3.比对和peak检测

image.png

4.转录因子关联基因富集分析

如果TF1结合到2000peaks,对应1800基因,其中有300基因与耐寒相关,说明TF1确实与耐寒相关。

5.motif分析

image.png

6.分析总揽图 image.png

最广泛使用的是MEME,还有homer。

  • Motif Scanning

假如测到AF1这个转录因子,结合了3000个peaks,但它在全基因组能够结合的位点可能有5000个,只是在对梅花进行测序的样本中,正好结合到了3000个位置,只是在那个时间、那个样本、那个条件中,能结合到了3000个位置。因此可以拿着这个motif到全基因组进行搜索。

结果发现还有2000个结合位点没测出来,那么为什么这2000个没测出来,那3000个测出来了,也值得研究。可能会发现这2000个,可能跟其他的什么功能相关,也值得去比较。

  • Motif Comparison 把鉴定到的motif跟数据库里面去进行比较,看看这个motif之前有没有人发现,你发现的AF1的motif跟数据库里面的,有没有其他转录因子家族的motif跟这个长得比较相似。
  • 重点软件:MEME,FIMO,Tomtom,整合成MEME-ChIP,还会自动调用CentriMo。

7.组蛋白修饰

  • 甲基化:组蛋白与DNA结合,DNA附近有基因,是否甲基化与基因的表达相关。

image.png

7.1 组蛋白修饰的结合位点

image.png 尖峰:narrow peak;

宽峰:broad peak;

混合:mix peak;

  1. ChIP-seq的缺点:

image.png

8.1 使用CUT&RUN的方法改进

image.png

抗体上有lgG能够与pA-MNase的pA结合。

  • ChIP-seq的抗体能不能直接拿来用? 答:不能。必须有lgG结构。要进行改造。

8.2 Tn5转座酶

  • TE转座子: Transposable Element

其中的一个就是Tn5。以前的核酸内切酶,要识别固定的剪切位点。 而这个转座子Tn5几乎没有要求,但有一定的偏好性,结合到哪就切到哪,切割比较随机。

以前随机打断是用超声打断。现在用Tn5随机打断。

  • Tn5不随机会有什么问题呢?

答:打断的片段有的长,有的短。而随机打断就不会有偏好性,基因组所有位置都能被覆盖到。

8.3 CUT&Tag和ChIP-seq比较

image.png

CUT&Tag和CUT&RUN解决的就是细胞数量少的问题。人/小鼠做scATAC-seq。

8.4 单细胞CUT&Tag

image.png

8.5 三种技术的比较

image.png

尽量做CUT&Tag,主要是细胞起始量。

image.png

    1. 通过相关性看出来:CUT&Tag的噪音少,因为是原位切割的。
    1. 6M的数据就能检测到4万多个peak。
    1. 6M是reads的条数,6✖300=1800M的碱基数,1G=1024M,则1800M≈1.8G的碱基数。