首先是黏连蛋白cohesin:
顾名思义,就是拿来连接黏连用的,黏连的对象就是姐妹染色单体,所以重点是在有丝分裂期间
然后就是环挤出模型,一个比较经典的三维基因组结构模型
首先是染色质的折叠结构层次:
参考:
上海交大学者观测到染色质“喷射”现象,为DNA环挤出提供关键体内证据,促进对3D基因组构建机制的理解
下面是正文:
一,summary总结
contatc domain:实际上是TAD(基本的三维转录结构单元unit)
loop domain:实际上就是loop(常说的EPC)
compartment domain:应该就是AB区室,毕竟提到了组蛋白修饰标记(因为AB转录活跃失活,实际上就可以用组蛋白code富集程度来衡量)——》后面来看应该不是这个概念
主要观点
- 基因组结构: 人类基因组通过折叠形成了称为“接触域”的间隔,这些间隔内部接触频率较高。
- 环域与区室域: “环域”因CTCF和cohesin的结合在同一条染色体上形成,而“区室域”是在具有相似组蛋白标记的基因组间隔间共分配形成的。
- cohesin降解的影响: 降解cohesin会消除所有环域,但不会影响区室域或组蛋白标记。环域的丧失并不会导致广泛的异位基因激活,但会对一部分活跃基因产生影响。
结论
降解cohesin后,尽管所有环域消失,活跃基因的调控仍受到影响,特别是超级增强子在染色体内外共定位,形成多个连接,从而变化了附近基因的调控。
逻辑链
- 基因组折叠 → 形成接触域和环域。
- cohesin的角色 → 负责维持环域的结构。
- cohesin降解 → 导致环域消失,但不影响区室域。
- 影响基因调控 → 环域损失导致部分活跃基因的调控受到影响,尤其是超级增强子的共定位。
- cohesin恢复 → 虽然重建速度不同,但许多百万碱基大小的环在短时间内恢复,支持快速环挤压的模型。
二,introduction
这段内容的主要观点是CTCF蛋白和环状cohesin复合体在染色质上共定位,并可能在基因组折叠和结构功能中发挥重要作用。作者通过引用多项研究来展示这两个蛋白质的作用及其互相关联的证据,但也提到了一些初步的低分辨率实验结果,这些结果显示在CTCF和cohesin的全基因组去除的情况下,基因组的结构仍然部分存在,导致难以明确这两个蛋白在基因组架构调控中的具体作用。
逻辑链如下:
- CTCF和cohesin的定位:研究表明CTCF和cohesin在染色质上共定位,并在环和接触域的边界处发挥作用。
- 功能推测:因此,推测这两个蛋白质有助于调控基因组的折叠。
- 实验支持:删除CTCF位点干扰环和接触域的形成,支持了这个推测。
- 矛盾发现:然而,初步实验显示,在CTCF和cohesin被去除的情况下,染色体结构并未出现明显变化,提出了相反的观点。
- 结论:这些结果使得明确CTCF和cohesin在基因组架构调控中的角色变得困难。
综上所述,这段内容探讨了CTCF和cohesin在基因组结构中的复杂作用,呈现了现有研究中的一致性与矛盾,使得进一步研究显得尤为重要。
三,result
1,
这段内容的主要观点是介绍了一种利用植物激素生长素诱导降解RAD21蛋白的方法,以研究其在凝聚素复合体中的功能。
主要观点
- 方法介绍:采用生长素诱导降解(AID)系统来快速降解RAD21,这是一种凝聚素复合体的核心组分。
- 细胞模型:实验使用了HCT-116人类结直肠癌细胞系,并且该细胞系的RAD21基因被改造,带有AID域和荧光标记。
- 结果确认:经过6小时的生长素处理后,RAD21-mAC的降解率高,且相应的凝聚素无法再与DNA结合,这通过荧光显微镜和ChIP实验得到证实。
结论
RAD21通过AID系统能够被有效降解,从而导致凝聚素无法与DNA结合,表明RAD21在凝聚素复合体的功能中起着关键作用。
逻辑链
- 引入实验方法:首先介绍AID系统及其工作机制。
- 应用实例:接着说明如何在HCT-116细胞系中实施该方法,并展示基因改造的背景。
- 实验验证:通过实验方法(如荧光显微镜和ChIP-Seq)验证RAD21的有效降解及其对凝聚素与DNA结合的影响。
- 结果及其意义:最终得出结论,强调RAD21在细胞生物学中的重要性,特别是在凝聚素复合体中的角色。
2,
3,
做过hic的都知道,domain是一个square(当然对称矩阵可以用上三角或者是下三角表示)
loop就是一个peak
经典的APA分析,将所有的loop domain都sum over然后average
4,
注意:NIPBL 将粘连蛋白加载到染色质上
这段内容的主要观点是:环域的恢复速度与NIPBL结合水平以及超级增强子的富集密切相关。具体来说,形成的实验通过Hi-C技术获得了大量细胞接触数据,从中分析了不同环域在去除植物激素后恢复的速度,并发现恢复较快的环域通常具备较高的NIPBL结合,以及丰富的启动子、增强子元素和活性组蛋白修饰标记。
主要结论:
- 恢复速度不同:环域的恢复速度差异显著,快速恢复的环域与高水平的NIPBL结合及多样的增强子结构相关。
- 超级增强子的作用:超级增强子(SEs)显著影响环域恢复,快速恢复的环域更可能跨越这些区域。
- 表观遗传标记:快速恢复的环域通常带有活性标记(如H3K36me3和H4K16Ac),而慢速恢复的环域则倾向于富集抑制标记(如H3K27me3和H3K9me3)。
逻辑链:
- 数据收集:通过Hi-C实验在不同时间点收集2.6亿个细胞接触数据。
- 恢复曲线计算:利用改进的联系图计算个别环域的恢复曲线。
- 恢复速度与特征关联:分析显示,快速恢复的环域与高水平的NIPBL结合、增强子元素和活性组蛋白标记相关。
- 超级增强子的影响:快速恢复环域与超级增强子的关联性明显,快速环域跨越SE的可能性是慢速环域的159倍。
- 表观遗传标记的对比:进一步对比了快速和慢速恢复环域的表观遗传特征,揭示了它们在恢复机制上的本质差异。
此段内容通过系统的数据分析揭示了基因调控的复杂性和细胞内环域结构恢复的生物学基础。
5,
区室的计算定义以及老分析:
contact——》P相关性分析——》PCA降维,然后看PC1 sign
这段内容主要探讨了细胞中基因组的分区化(compartmentalization)与粘连蛋白(cohesin)丧失之间的关系。以下是该段内容的主要观点、结论和逻辑链分析:
主要观点
- 分区化的定义:基因组被划分为不同的区间,这些区间具有不同的特性,例如开放和闭合的染色质(A和B compartments),并形成不同的子区间(如A1、A2等)。
- 粘连蛋白失去的影响:尽管粘连蛋白丧失会导致环状结构(loop domains)完全消失,但分区化的现象仍然被保留,并且在某些情况下变得更强。
- 相互作用的分析:分区边界的相互作用显示,在粘连蛋白缺失的情况下,基因组中的接触模式发生了显著变化,细胞中形成的“方格模式”得到了加强。
结论
- 基因组的分区化过程不依赖于粘连蛋白的存在,反而在粘连蛋白缺失后能够增强。这表明,粘连蛋白所依赖的环状结构可能会干扰分区化,促使具有不同组蛋白修饰的区间相互独立。
逻辑链
- 背景介绍:首先引入分区化的概念,并明确其与染色质状态的关系。
- 实验结果:通过各种实验(如使用auxin处理细胞)验证粘连蛋白丧失对分区化的影响,发现分区仍然存在,且对接触频率的影响有所增强。
- 相互作用分析:进一步探讨分区与环状结构的关系,发现粘连蛋白缺失后,分区边界的接触模式变化更大,暗示了这两者之间的竞争关系。
- 与其他研究的关联:引用前人的研究结果,增强论点的可信度。
总结
综上所述,该段内容表明,尽管粘连蛋白在形成环状结构中起着重要作用,但基因组的分区化是一个独立于粘连蛋白的过程,且在缺失粘连蛋白的情况下,这种分区化反而会更加明显。
在这段描述中,我们可以对细节进行深入分析,特别是“compartment”(隔室)和“loop”(环域)的逻辑关系。
1. 隔室与环域的作用
隔室和环域在基因组的空间结构中扮演着重要角色。隔室是基因组中一组具有相似表观遗传特征的区域,而环域则是连接这些区域的一种重要结构。
2. 隔室边界的定义
- 边界位置:文中提到有两种类型的隔室边界:
-
- (i) 处于未处理细胞环域内部的边界。
- (ii) 与未处理细胞的环域锚点重合的边界。
这种边界的划分对于理解基因组的空间组织至关重要。
3. 细胞处理的影响
- 影响对比:未处理与处理细胞的对比显示,若边界位于环域内部,则在去除cohesin(粘连蛋白)后,相反侧之间的接触模式的相关性明显减弱,这表明在缺失cohesin时,基因组的“格子模式”变得更强烈。这暗示着环域的形成与隔室的分隔存在某种干扰关系。
4. 不同表观遗传标记的分析
- 文中提到分析了H3K27Ac和H3K27me3标记的富集和缺失区域:
-
- H3K27Ac标记通常富集于“A”隔室。
- H3K27me3标记则与“B1”亚隔室相关。
分析结果显示,隔室的组织过程并不依赖于cohesin,这意味着不同表观遗传特征的基因组区域可以自然地形成隔室。
5. 环域对隔室化的干扰
- 干扰机制:去除cohesin后,格子模式的增强意味着cohesin依赖的环域干扰了隔室化的过程。这表明,环域的形成倾向于将具有不同表观遗传修饰的区域共同定位,从而影响隔室的稳定性。
6. 与已有研究的一致性
- 文中提到的观察与Haarhuis等人的研究结果相一致,后者表明在缺失cohesin拮抗物WAPL时,基因组隔室化减弱,导致环域增大。这进一步 corroborates了环域和隔室之间的复杂交互关系。
结论
通过对上述细节的分析,可以看出,隔室和环域在基因组的组织中相互作用,cohesin的存在不仅支持环域的形成,还可能对隔室化过程产生负面影响。这些发现为理解基因组的空间结构提供了新的视角,并揭示了表观遗传修饰在这种结构中的重要性。
6,
cohesin-associated:应该是没有降解cohesin、处理之前注释出来的loop
cohesin-independent:在降解cohesin之后注释出来的loop
这个图初看是类似于p密度曲线(但是loop鉴定算法大家都知道,其实是离散的,所以应该是p质量曲线,也就是不是看AUC=1,而是看point sum over=1),而且这个比例应该是看各自分类里的比例,因为两种loop数目差异比较大。
然后比较的对象是:
黏连蛋白丢失之后依然存在/注释出来的loop:61个(cohesin-independent)
黏连蛋白丢失之后就消失的loop:3170个
黏连蛋白独立/不相关的loop是不能划定contact domain的边界(应该是边界没有富集)
许多独立于黏连蛋白的环锚与另一个环锚之间形成了链接(表现为Hi-C热图中的焦点峰),即使这些锚位于不同的染色体上——》焦点峰focal peaks
那应该是loop anchor之间形成了1个网络,其中anchor是节点,然后loop是边,我们正常所见到的都是:node1——node2这种2节点1边的网络motif,但是这里说的其实是anchor之间形成了多边链接,也就是出现了degree度的概念,说白了就是某个anchor成为了hub节点
其实按理来说,不应该使用这一幅图来说明,既然是要说明cohesin不依赖的loop,实际上是一个super-loop,那么就应该使用22连接的anchor比对图;
当然下面这张图也能说明:
我们先关注红点(就是热图中的peak):它们确实是loop,然后对应的两端轴就是anchor,比如说chr6的锚点和chr2上的锚点之间形成了loop,然后又和chr4上的锚点形成了loop
至于最下面的chr6实际上就是3个锚点之间22形成loop,也就是link
如果是看图的话:这里其实就是正常的hic热图,x轴是chr6上的143Mb到162Mb
y轴是chr2/4/6上面的某个片段,然后就是正常展示的hic互作热图,
至于H3K27ac对应的-+应该就是展示有没有cohesin降解前后这些区域对应的marker修饰水平如何
然后就是对anchor锚点的蛋白结合分析:
主要考察的其实就是和CTCF的共定位,如果是cohesin非依赖性
其实看这个图,就可以看出来:
在不同条件下CTCF(CCCTC-binding factor,CCCTC结合因子)锚点在基因组环状结构中的分布和取向情况。CTCF是一种DNA结合蛋白,它在基因组的三维结构中起着重要作用,特别是在形成染色体环状结构中。
图表分为两部分,分别展示了在没有生长素(-auxin)和有生长素处理6小时(+auxin, 6hr)两种条件下的CTCF锚点分布:
- -auxin (n = 5177):
-
- 正确取向的CTCF锚点(蓝色)占55%。
- 倒置的CTCF锚点(绿色)占3%。
- 多个CTCF位点(红色)占32%。
- 没有CTCF位点(灰色)占10%。
- +auxin, 6hr (n = 64):
-
- 没有CTCF位点(灰色)占83%,这表明在生长素处理后,大多数环状结构不再有CTCF锚点。
- 正确取向的CTCF锚点(蓝色)占8%。
- 倒置的CTCF锚点(绿色)占6%。
- 多个CTCF位点(红色)占3%。
与cohesin(粘连蛋白)相关的环状结构相比,cohesin非依赖性环状结构中CTCF的结合比例要低得多(20%对90%)。此外,cohesin相关的环状结构中,CTCF基序倾向于指向环内(95%),而在cohesin非依赖性环状结构中,只有56%的CTCF基序指向环内。
结合图表和文本,我们可以得出以下结论:
- 在没有cohesin的情况下,大多数环状结构(55%)具有正确取向的CTCF锚点,这可能有助于稳定环状结构。
- 生长素处理后,大多数环状结构失去了CTCF锚点(83%),这可能表明cohesin对环状结构的稳定性有影响,或者改变了CTCF的结合模式。
- cohesin非依赖性环状结构中CTCF的结合和取向与cohesin相关环状结构有显著差异,这可能反映了两种环状结构在功能和调控机制上的不同。
这张图展示了36种DNA结合蛋白和组蛋白修饰中,非cohesin依赖的环锚点与超级增强子(super-enhancers)的结合百分比与富集倍数之间的关系。图中的横轴表示环锚点结合的百分比,纵轴表示富集倍数(Fold Enrichment)。
这个图应该这么理解:就是一共有36中修饰或者是蛋白(总之是marker),然后每个marker都有一个(x,y)坐标,x是这个marker究竟占据了cohesin无关loop的多少比列锚点,
比如说这些cohesin无关的loop的锚点中,有50左右的比例是结合前100个rank的SE,然后y轴应该是个数上对比没有经过处理的cohesin依赖性的loop中的anchor,富集倍数的差异
图中有几个关键点:
- 超级增强子(super-enhancers):图中用红色点表示,共有387个。这些区域在基因调控中起着重要作用,通常与关键基因的高表达相关。
- 前100个超级增强子:在387个超级增强子中,前100个被特别标注,显示出更高的富集倍数,最高可达76倍。这表明这些区域在cohesin-independent loop anchors中的富集程度非常高。
- H3K27ac修饰:蓝色点表示H3K27ac修饰的位点,这是一种与活跃增强子相关的组蛋白修饰。这些点的富集倍数相对较低,但随着环锚点结合百分比的增加,富集倍数也有所增加。
- cohesin-independent loop anchors:这些是与cohesin蛋白无关的环锚点,它们在超级增强子中的富集程度非常高。在HCT116细胞中,64个cohesin-independent loop anchors中有41个与387个超级增强子重叠,显示出37.5倍的富集(p值小于10^-15,表示统计学上极其显著)。
- 未处理细胞中的cohesin-independent loops:在未处理的细胞中,cohesin-independent loops及其与超级增强子之间的联系也存在,但强度较弱。
综上所述,这张图强调了cohesin-independent loop anchors在超级增强子中的显著富集,尤其是在前100个超级增强子中。这种富集可能与这些区域在基因表达调控中的关键作用有关。同时,这也表明即使在未处理的细胞中,这些结构也存在,但功能可能受到限制或调节。
上图如果简单来看,只能说是生长素治疗(没有cohesin)和撤药(有cohesin)的时间过程中,观察到的cohesin不依赖/独立的loop/互作/联系link的强弱变化,简单来说就是随着cohesin的消失,互作变强,然后随着cohesin的恢复,互作减弱。
然后这里的结论其实是除了用生长素处理的细胞中能观察到cohesin独立的loop与SE的intra的连接互作,
在没有使用生长素处理的细胞中也能观察到,cohesin独立的loop与SE的intra的连接互作
也就是说无论有没有cohesin,都有一群loop(本身的形成是与cohesin无关的)和SE之间存在连接link
对角线上方是使用生长素处理没有cohesin的,下方是有cohesin的
我们可以看到这些锚点区域两两之间都有互作,也就是图的邻接矩阵的上三角矩阵中都有连接,是全1矩阵,边都是有值的,说明这是个全连接的图(任意两个节点之间都有边)。
所以这里的意思就是这里全连接的图中,所有的节点(区域)聚集在一起相当于形成了一个团块(其实就是SE起初相分离的概念);
黏连蛋白cohesin的缺失导致锚形成一个小团块cliques,几乎所有的环锚对anchor区域之间都可见到局部的相互作用,无论它们是否位于同一条染色体上。
然后这里显示的是:每个矩阵显示一个以各自的锚为中心的2x2 Mb的区域,也就是说虽然是矩形,但是我们看的还是应该是peak、anchor、点dot
===》其实这里还对不依赖于cohesin的loop的anchor的性质进行了一个解析:
不依赖于cohesin的loop,类似于超环super loop,有好几个特点:
①非常大,高达77Mb
②它们跨越的区间不形成接触域,也就是它们跨越的区域之间的互作频率不会很高
③它们之间的锚点anchor倾向于形成小团块cliques,并且锚点之间富集H3K27ac标记
===》最后是想检验是否cohesin独立的loop所形成的super-loop(全连接图)的hub节点是否包含多个anchor loci
然后这里试验了concatemer的概念(串联体,多个loci互作拉下来的reads片段,因为一般的hic获取的互作矩阵实际上捕获的都是两个loci位点之间的互作)
从上面这张图可以看到,其实捕获的技术手段都是一致的,都是使用的是交联,然后回帖之后是多个基因组区段
然后就是n维的张量tensor(其实就是高维矩阵/向量了,MLDL之类)
高维的话还是要仿照2维的hic互作矩阵做一个高维APA分析:
3D聚合峰分析(APA)使用未经处理的原位Hi-C数据对所有131个染色体内粘连蛋白独立的环锚进行分析,选择这样的三联体中的每个锚与其他两个锚位于相同的染色体上,但没有两个锚位于彼此之间10 Mb内
——》这里选取的三联体还是有依据的,就是使用位于同一染色体上但是任意两个锚点之间间隔10Mb开外
反正这里就是分析3D APA(如何分析的):就是切出子张量
Hi-C的三维聚合峰分析(APA)是理解基因组结构和相互作用的重要工具。以下是进行此类分析的要点和操作算法细节:
1. 数据处理:
- 数据集选择:选取未经处理的in situ Hi-C数据,目的是分析131个染色体内的锚点(cohesin-independent loop anchors)三元组。每个三元组的锚点位于同一条染色体上,且相互之间距离大于10Mb,以避免局部结构的干扰。
2. 3D APA立方体的构建:
- 立方体的构建:为每个三元组中心截取一个大小为3.9 × 3.9 × 3.9Mb的子张量(subtensor),并将这些结果叠加到一起形成3D APA立方体。每个立方体以300kb的分辨率呈现,意味着每个体素(voxel)对应于三个基因组位置之间的所有碰撞。
3. 坐标轴的设置:
- 坐标轴配置:在立方体中,离染色体p端最近的锚点对应z轴,q端最近的对应y轴,而中间位置则对应x轴。这种设置有助于在分析中保持一致性。
4. 体素颜色编码:
- 颜色表示:每个体素的颜色表示该体素内的碰撞数量,体素颜色直方图展示了每种颜色体素的数量。重要的是没有任何体素的碰撞数大于5,而中心体素(表示三锚点之间的所有碰撞)没有碰撞记录。
5. 中心截面展示:
- 截面分析:
从结果分析中发现,3D APA立方体的中心处没有显著的富集现象,这表明三条锚点之间并没有强烈的物理相互作用。
-
- 上行:显示z轴上的中心截面及其相邻截面。
- 中行:展示y轴上的中心截面及其相邻截面。
- 下行:展现x轴上的中心截面及其相邻截面。
6. 结果解释:
- 此类分析为基因组结构提供了空间视角,使研究者能够识别和验证不同基因组区域之间的相互作用,帮助理解基因调控机制。
在分析过程中,需要注意的技术细节包括数据预处理、合适的分辨率选择、以及如何有效呈现和解释立方体中的数据。
这段内容主要探讨了失去cohesin(蛋白质复合物)后,超增强子之间的联系如何变化。以下是对内容的分析,包括主要观点、结论和逻辑链。
主要观点
- cohesin缺失后环路减少:在细胞失去cohesin的情况下,未与接触域相关联的环路数量显著减少,从1030个降至72个,其中57个被认为是假阳性。
- cohesin独立环路的特征:剩余的15个环路显著增大,说明在失去cohesin的细胞中,能够更可靠地识别大的环路。
- 超增强子间的相互链接加强:cohesin缺失后,超增强子之间形成了大量的联系,尤其是在不同染色体之间。
- cohesin独立环路的蛋白质结合模式不同:cohesin独立环路的锚点与cohesin相关环路在CTCF结合模式上有显著差异,且cohesin独立环路的锚点显著富集于超增强子。
结论
- 失活cohesin导致超增强子之间的联系变得更强,并形成了一个连续的网络。这些cohesin独立环路并不划定接触域的边界,且其锚点之间存在显著的相互作用,即使在不同染色体间也能形成关联。
- 名为“superloop”的结构在无cohesin的情况下表现得更为明显,这些环路可形成包含多个锚点的集群,从而增强了基因组中不同区域的相互作用。
逻辑链
- 背景:分析开始于对细胞内环路的初步观察,发现cohesin缺失导致环路数量减少。
- 数据分析:通过高通量测序,识别环路的特性并使用不同分辨率的算法来确认这些环路的存在。
- 相互作用的增强:在cohesin缺失的情况下,超增强子之间的联系方式得到加强,形成更复杂的网络。
- 蛋白质结合特征的对比:进一步分析显示这些环路的锚点具有不同的蛋白质结合特征,揭示了cohesin缺失后的分子机制。
- 对比与归纳:将这些发现与之前的superloop研究进行对比,得出在cohesin缺失情况下,环路的行为相似但更加极端。
这段内容通过严谨的数据分析和对比,揭示了cohesin在染色体结构和基因调控中的关键作用,以及因其缺失所带来的分子机制变化。
7,
这段内容的主要观点是,分子动力学模拟结合了挤出和区室化机制,能够成功再现Hi-C实验结果。这一研究探讨了在染色体结构中观察到的两种不同折叠机制的假设。
主要观点:
- 模型构建:研究者将3号染色体上的2.1 Mb区域模型化为一种块共聚物,使用ChIP-Seq数据分类不同的染色质类型(A型和B型),并利用CTCF结合位点的信息。
- 模拟机制:通过分子动力学模拟,探讨了在含有挤出复合物的溶液中,这种聚合物的行为,并研究了相似单体之间的吸引力以模拟区室化现象。
- 相互印证:所创作的计算接触图与Hi-C实验结果相符,表明主要的Hi-C数据特征(如环、域和区室)能够通过此模型再现。
逻辑链:
- 提出假设:研究者假设Hi-C接触图与两种不同折叠机制有关。
- 模型设计:基于ChIP-Seq数据创建了包含CTCF结合位点的染色质模型。
- 实施模拟:使用分子动力学方法,结合挤出和区室化的机制来模拟染色体行为。
- 数据对比:将模拟结果与实际Hi-C实验结果进行比对,发现两者高度一致。
- 进一步探索:分析了组蛋白尾部相互作用对染色体折叠的影响,提出可能存在多种模型来解释与组蛋白标记模式相关的相分离现象。
结论:
通过这项研究,科学家确认了分子动力学模拟结合挤出和区室化机制能够有效地再现Hi-C实验结果,提供了理解染色体构象和基因组组织的新思路,并提出了关于组蛋白尾部与染色体折叠关系的深入探讨。
8,
为了研究cohesin黏连蛋白对gene表达调控的影响,然后原本cohesin被认为是促进EPC互作的(cohesin促进loop,loop用于限制/规范/纠正正确的EPC互作——》cohesin对gene表达调控的影响就是阻止异位激活)
然后我们检测的是新生转录本:所以用pro-seq
在cohesin丢失前后(loop结构域破坏前后)去比对gene表达的异常情况——》就是查看有没有异常gene激活事件发生
未经处理cell:不表达的14853 genes
未经处理的cell:表达的12222个gene
cohesin丢失/loop结构域破坏前后,这些gene并没有表现出转录水平的变化
虽然数量不多,但是可以看质量
没有什么好分析的了,只能分析变化倍数比较大的这些gene,再细分上调还是下调,简单来说就是没活了+凑字数;
当然能从个例上说明,cohesin相关的loop是鉴性的,既能激活又能抑制(异常激活)
一个超级增强子附近的强下调基因的例子。在未处理的细胞中,IER5L启动子和附近的超级增强子之间形成一系列黏连蛋白相关环。在生长素处理后,这些环消失,IER5L表达下调2.6倍。
生长素处理后1.75倍下调基因(红色)与随机基因(黑色)距离最近的超级增强子的累积概率分布。
只能说强烈下调的gene离SE很近(在比对之下)
这段内容的主要观点是:缺失凝聚素(cohesin)导致靠近超级增强子的基因表达显著下调,但不会引起广泛的异位激活。
主要观点:
- 凝聚素的作用:凝聚素被认为促进增强子与启动子之间的相互作用,并通过循环结构来防止增强子与不同环域的目标基因形成异位相互作用。
- 实验方法与结果:
-
- 采用精准核标志转录组测序(PRO-Seq)研究凝聚素缺失对基因表达的直接影响。
- 在处理后6小时观察到,与超级增强子邻近的基因显著下调,而未表现出普遍的异位基因激活。
结论:
- 基因表达变化:在未处理细胞中高表达的基因在缺失凝聚素后变化不大,大多数保持原有的表达水平,仅少数基因显示出显著的表达变化(87%的基因表达水平未发生显著变化)。
- 异位激活的防止:尽管聚集素在防止异位激活中发挥了作用,但大多数基因在缺失凝聚素及循环结构时仍然维持非激活状态。
逻辑链:
- 凝聚素与基因调控关系:凝聚素通过调节增强子与启动子的接触来影响基因的转录。
- 实验设计:进行PRO-Seq实验,以评估凝聚素缺失后的基因表达情况,选择早期时间点避免细胞状态变化的干扰。
- 数据分析:数据表明,靠近超级增强子的基因显示出明显的表达下调,而未激活基因的异位激活极为少见。
- 影响机制破解:基因表达下调与超级增强子的位置有关,说明在有凝聚素的情况下,超级增强子的联系较强,缺失后则增强子间多为弱联系。
总体来说,研究揭示了凝聚素在基因表达调控中的重要性,强调其在阻止不恰当的基因激活以及促进适当的转录相互作用中的双重作用。
总结
总体而言这边文献是以探究1个奇特的现象所研究的2种基因组折叠机制:
参考:Cell:绘制出人基因组自我折叠的四维图谱
基因组折叠的两种机制是挤压(extrusion)和区室化(compartmentalization)。
- 挤压(Extrusion):
-
- 黏连蛋白在细胞核中产生DNA环状结构,通过将相隔的DNA序列元件快速连接。这一机制表现为黏连蛋白的存在使得数以千计的DNA环状结构形成或消失。
- 区室化(Compartmentalization):
-
- 不依赖于黏连蛋白,此机制能够将大群的DNA序列元件连接在一起,即使它们位于不同的染色体上。它与挤压相比,能够实现更大范围内的序列元件连接。
表达比对
机制 | 特点 | 作用范围 |
挤压 (Extrusion) | 需要黏连蛋白,快速连接近邻DNA元件 | 限于同一条染色体上的DNA元件 |
区室化 (Compartmentalization) | 不需要黏连蛋白,连接远处或不同染色体上的DNA序列元件 | 跨染色体,相对广泛 |
这两种机制共同作用于基因组的动态折叠和功能调控,帮助细胞在不同刺激下做出反应。
现象就是:
所以相当于是存在除了环挤出之外其他的基因组折叠机制,使得有两种loop结构形式存在。
这篇文章探讨了人类基因组的折叠机制,特别是环挤出和区室化机制,并通过研究cohesin的降解对这些机制的影响,揭示了基因组的空间结构和基因表达的调控。
1. 内容概述
1.1 基因组折叠机制
- 接触域(Contact domains):是指在基因组中形成的高频接触区间。
- 环域(Loop domains):通过CTCF和cohesin的结合形成,连接染色体上两个特定的基因位点。
- 区室域(Compartment domains):具有相似组蛋白标记的基因组区域共同聚集形成。
1.2 研究目的
- 研究cohesin降解对环域和区室域的影响,确认环挤出和区室化机制的独立性。
2. 实验方法
2.1 裂解cohesin的技术
- 使用Auxin诱导降解(AID)系统快速降解cohesin的核心组分RAD21。
- 对HCT-116细胞进行改造,使其能够通过附加标记追踪RAD21。
2.2 实验步骤
- Basal状态下的基因组结构:通过ChIP-Seq分析确认RAD21在染色质中的结合情况。
- cohesin的降解实验:在添加auxin后,观察RAD21的降解,对染色质进行重建。
- Hi-C实验:使用Hi-C技术绘制基因组接触图,比较降解前后的差异。
3. 结果分析
3.1 cohesin的降解和环域消失
- 在cohesin降解后,所有环域消失,但区室域和组蛋白标记保持不变。
- 降解后的Hi-C图谱中,环域的“亮点”消失,仅剩少量虚假阳性环域。
3.2 环域重新形成的速率
- 一些较大的环域在cohesin恢复后短时间内重新形成,显示出环挤出机制的高效。
- 环域恢复速度与NIPBL结合、增强子和特定组蛋白标记的富集度相关。
3.3 cohesin影响区室化
- 尽管环域消失,但层次化的结构仍得以维持,表明区室化是cohesin独立的。
- 降解后,区室间的接触频率增强,表现出更强的区室化效应。
3.4 超增强子连接的加强
- cohesin的丧失导致超级增强子之间的连接加强,形成多个内外染色体的链接,影响相邻基因的调控。
4. 逻辑链分析
- 基因组折叠机制概述:
-
- 确立环挤出与区室化的定义和相关蛋白(CTCF、cohesin)的作用。
- 实验设置和方法:
-
- 选择HCT-116细胞,进行cohesin的特定标签和荧光监测。
- cohesin降解后对基因组的影响:
-
- 环域通过cohesin维持,降解后的接触图谱验证了这一点。
- 恢复机制的观察:
-
- 通过时间序列的Hi-C实验观察环域的恢复过程,建立了cohesin与环域之间的关联。
- 对区室化的影响评估:
-
- 虽然cohesin消失,但区室化效果增强,提示其与环域折叠机制的独立性。
5. 研究的意义
该研究显示了不同折叠机制(环挤出与区室化)在基因组组织中扮演的独立角色,为理解基因调控及其空间结构提供了新的视角。尤其对于超级增强子的聚集效应,展现了它们如何在缺乏cohesin的条件下重新形成功能性连接。
其中重点是loop的形成机制:基因组折叠机制
为了验证基因组折叠的两种机制——挤压(extrusion)和区室化(compartmentalization),研究人员采用了分子动态模拟和实验观察的方法。
挤压机制的验证
- 模型构建:
-
- 研究人员建模了3号染色体上一个2.1 Mb的区域,将该区域视作由两种不同类型的染色质(A和B)组成的嵌段共聚物。这些类型是根据ChIP-seq结合数据进行分类的,并含有CTCF结合位点。
- 实验条件下的观测:
-
- 通过破坏黏连蛋白,观察到当这一关键蛋白被去除时,成千上万个DNA环状结构消失。相反,当再引入黏连蛋白后,这些环状结构迅速重新出现,这支持了挤压模型的假设。
- 数据对比:
-
- 模拟生成的接触图与实验中观察到的接触模式相一致,显示出环的形成和消失情况,这进一步证实了挤压机制的存在。
区室化机制的验证
- 多种机制的考虑:
-
- 研究者通过观察DNA环状结构的变化,发现某些结构在激活时呈现出增强的趋势,这与挤压机制的预期相反,提示可能存在其他机制的介入。
- 模拟和观察:
-
- 在分子动态模拟中,通过引入相似组分之间的吸引力,模型展示了即使这些组分位于不同染色体上,它们也能快速形成聚集结构,支持区室化机制。
- 联系与扩展:
-
- 模拟显示,使用ChIP-seq数据的输入可以准确重现Hi-C数据集中观察到的特征(如环、区域和区室),表明区室化的机制同样能够通过物理模型进行有效模拟。
结论
综上所述,通过对挤压和区室化机制的建模、实验验证和数据对比,研究人员成功证明了这两种机制在基因组折叠中的作用。这些方法的结合不仅深化了对基因组空间结构的理解,也为未来的研究提供了新的视角。
重点重申
研究表明,基因组折叠的两种主要机制为挤压(extrusion)和区室化(compartmentalization)。以下是这两种机制的详细观点和操作细节:
- 挤压机制:
-
- 挤压机制依赖于黏连蛋白(cohesin)。在这一过程中,黏连蛋白能够将相隔远的DNA序列迅速连接形成环状结构。研究显示,破坏黏连蛋白会导致成千上万个DNA环状结构的消失,而重新引入黏连蛋白后,这些结构又能够迅速恢复。这表示黏连蛋白在DNA上移动的速度在已知蛋白质中是最快的,支持了其在DNA环状结构形成中的关键作用.
- 区室化机制:
-
- 区室化机制则不依赖于黏连蛋白,能够将远离的序列元件进行聚集连接。研究指出,这种机制较挤压更为广泛,能够连接位于不同染色体上的大群序列元素。通过仔细观察DNA环状结构的变化,科学家们意识到区室化与挤压机制在细胞核中的作用有所不同,但同样能够快速完成连接。模拟结果表明,只有在结合了挤压和区室化机制的情况下,模拟结果才能与实际的Hi-C实验结果一致,充分显示了这两种机制在基因组组织中的重要性。
在具体操作上,研究人员使用了分子动态模拟来研究这两种机制的结合效应。通过对3号染色体的2.1 Mb区域进行模拟,研究人员使用了来自CTCF和SMC1的ChIP-seq信号,以此构建了模拟的挤压复杂体。这些信号经过处理后,转化为用于模拟的结合概率,从而帮助理解环的形成和相互作用模式。模拟结果显示,通过引入与挤压和区室化相关的吸引力,能够有效重现Hi-C实验中观察到的相互接触图谱。
综上所述,挤压和区室化机制相互补充,共同作用于基因组的折叠和功能调控,为理解基因组在响应刺激时的动态变化提供了新的视角。
所以Fig4-7我的解读顺序是:
解读稿子:
当然并不是所有的loop形成都和黏连蛋白环挤出模型预期的那样,事实上,研究人员观察到,在黏连蛋白降解之后,有一些比较奇怪的DNA环状结构变得更强,而在黏连蛋白恢复水平之后,这些loop反而消失了。
也就是说,存在一些不依赖于黏连蛋白以及环挤出机制所形成的环,并且这种序列之间的接触互作不仅仅在染色体内发生,在染色体间也存在。
这些现象表明,存在区别于环挤出的第二种折叠机制,而解析这些机制的关键就是研究这些多出来的、新冒出来的环。
事实上,我们可以看到,不依赖于黏连蛋白的环,其长度相比黏连蛋白相关的环,要长的很多,数量级达到了Mb级别(属于超远程互作了);
并且这些环的锚点也展现出了差异的蛋白结合模式,首先是CTCF的结合比例降低了,并且CTCF蛋白的结合方向上也存在差异(因为我们知道环挤出模型是cohesin倾向于在一对收敛方向的CTCF对上辅助成环)。
当然,更有趣的是,我们注意到了这些锚点之间的两两互作,也就是pairwise link(从上三角矩阵比对下三角矩阵可以发现);如果每一个环的锚点是一个节点的话,那么所有这些节点相当于形成了一个全连接的图(网络结构),从hic热图中我们可以看到的是焦点的形式,那在生理情况下我们可以想象一下是什么呢?
其实就是团块(即答),其实就和相分离有关联了。
但是黏连蛋白相关的环就没有观察到这种染色体间团块连接的现象了。
当然这种团块不能仅仅局限于用2维的常规hic热图去看,其实仔细观察我们的hic上游湿实验技术,它自然也能捕获3个、4个甚至多个位点的互作,我们称之为串联体,n个位点就是一个n维tensor,也就是n维张量——》可以在n维空间中可视化n维互作热图,我们用于捕获验证实际包含多个位点互作的枢纽。
当然在环的锚点之上我们也发现了H3K27ac marker的富集,可以说绝大多数锚点都是和超级增强子有重叠的。
所以很自然的推论就是黏连蛋白的丢失导致超级增强子共定位,在染色体内、染色体之间形成了连接。
(而这个跨越多个超级增强子的团块结构,其中成对的连接和高阶的枢纽,就会被我们在hic矩阵中观察到)
当然,如果把这个团块再抽象成区室化概念,我们就可以总结介导环形成的两种机制,挤压以及区室化,
一个需要黏连蛋白,链接邻近序列元件,成环的结构;
一个不需要黏连蛋白,实际上链接的是成群的序列元件,成一个团块。
研究人员使用RAD21-mAC细胞3号染色体上的一段2.1Mb的区域来动态模拟这两种机制的结合效应,只有两者兼顾,结果才能与实际hic接触图谱一致。
进一步就是研究黏连蛋白对于基因表达的影响,
我们正常的逻辑就是黏连蛋白辅助成环是为了规范矫正增强子-启动子之间的互作,如果黏连蛋白消失了之后,按理来说会有一些异常的gene被激活,也就是异位激活。
但是实际发现,原本cohesin矫正下不表达的gene,基本上cohesin丢失之后还是不变;
而原本表达的那些gene,绝大多数gene转录水平也不变。
只有少数显著变化的gene,并且存在显著下调的gene,然后这些gene位于超级增强子附近,也就是我们之前所说的团块。比如说左边的IER5L
事实证明:
不要随意使用LLM助力翻译插件,仅适用于速读,精度、专用需求仍然要有道+zotero一字一段比对体会英文用词