1. 全称
- ChIP-seq: Chromatin Immuno Precipitation
- CUT&Tag: Cleavage Under Targets & Tagmentation
2. ChIP-seq原理
1.背景
- 转录速度的快慢:染色质马上打开还是缓慢打开;
- 转录出来mRNA条数的多少:丰度受到增强子、隔离子、沉默子的影响;
2.研究
假如,水稻中有转录因子TF1,与水稻耐寒相关 --> 推测梅花中是否有TF1,也与梅花耐寒相关,调控了哪些基因,从而与耐寒相关。
3.比对和peak检测
4.转录因子关联基因富集分析
如果TF1结合到2000peaks,对应1800基因,其中有300基因与耐寒相关,说明TF1确实与耐寒相关。
5.motif分析
6.分析总揽图
最广泛使用的是MEME,还有homer。
- Motif Scanning
假如测到AF1这个转录因子,结合了3000个peaks,但它在全基因组能够结合的位点可能有5000个,只是在对梅花进行测序的样本中,正好结合到了3000个位置,只是在那个时间、那个样本、那个条件中,能结合到了3000个位置。因此可以拿着这个motif到全基因组进行搜索。
结果发现还有2000个结合位点没测出来,那么为什么这2000个没测出来,那3000个测出来了,也值得研究。可能会发现这2000个,可能跟其他的什么功能相关,也值得去比较。
- Motif Comparison 把鉴定到的motif跟数据库里面去进行比较,看看这个motif之前有没有人发现,你发现的AF1的motif跟数据库里面的,有没有其他转录因子家族的motif跟这个长得比较相似。
- 重点软件:MEME,FIMO,Tomtom,整合成MEME-ChIP,还会自动调用CentriMo。
7.组蛋白修饰
- 甲基化:组蛋白与DNA结合,DNA附近有基因,是否甲基化与基因的表达相关。
7.1 组蛋白修饰的结合位点
尖峰:narrow peak;
宽峰:broad peak;
混合:mix peak;
- ChIP-seq的缺点:
8.1 使用CUT&RUN的方法改进
抗体上有lgG能够与pA-MNase的pA结合。
- ChIP-seq的抗体能不能直接拿来用? 答:不能。必须有lgG结构。要进行改造。
8.2 Tn5转座酶
- TE转座子: Transposable Element
其中的一个就是Tn5。以前的核酸内切酶,要识别固定的剪切位点。 而这个转座子Tn5几乎没有要求,但有一定的偏好性,结合到哪就切到哪,切割比较随机。
以前随机打断是用超声打断。现在用Tn5随机打断。
- Tn5不随机会有什么问题呢?
答:打断的片段有的长,有的短。而随机打断就不会有偏好性,基因组所有位置都能被覆盖到。
8.3 CUT&Tag和ChIP-seq比较
CUT&Tag和CUT&RUN解决的就是细胞数量少的问题。人/小鼠做scATAC-seq。
8.4 单细胞CUT&Tag
8.5 三种技术的比较
尽量做CUT&Tag,主要是细胞起始量。
-
- 通过相关性看出来:CUT&Tag的噪音少,因为是原位切割的。
-
- 6M的数据就能检测到4万多个peak。
-
- 6M是reads的条数,6✖300=1800M的碱基数,1G=1024M,则1800M≈1.8G的碱基数。