生物工程学报  2020, Vol. 36 Issue (2): 341-352
http://dx.doi.org/10.13345/j.cjb.190245
中国科学院微生物研究所、中国微生物学会主办
0

文章信息

杨根生, 焦芳芳, 吕瑞途, 郭睿
Yang Gensheng, Jiao Fangfang, Lü Ruitu, Guo Rui
超声处理对PRC2相关蛋白染色质免疫共沉淀测序结果的影响
Effect of sonication on results of ChIP-seq experiments involving PRC2 related proteins
生物工程学报, 2020, 36(2): 341-352
Chinese Journal of Biotechnology, 2020, 36(2): 341-352
10.13345/j.cjb.190245

文章历史

Received: June 11, 2019
Accepted: August 30, 2019
Published: September 5, 2019
超声处理对PRC2相关蛋白染色质免疫共沉淀测序结果的影响
杨根生1 , 焦芳芳1 , 吕瑞途1 , 郭睿1,2     
1. 复旦大学 生物医学研究院,上海 200031;
2. 复旦大学 附属浦东医院肿瘤科,上海 201399
摘要:超声处理是染色质免疫共沉淀(Chromatin immunoprecipitation,ChIP)实验过程中染色质片段化的重要手段之一。选用多梳抑制复合物2 (Polycomb repressive complex 2,PRC2)相关蛋白组蛋白甲基转移酶EZH2及其催化产物H3K27me3为代表,研究不同分子量大小的蛋白在不同超声处理时间下对染色质免疫共沉淀测序(Chromatin immunoprecipitation sequencing,ChIP-seq)实验的影响,结果表明在启动子区或非启动子区,不同超声时间下小分子量组蛋白H3K27me3结合位点的注释基因均无明显差异,说明超声时间对组蛋白ChIP-seq数据影响不大。与组蛋白不同,超声时间从10 min延长至20 min后启动子区EZH2新增结合位点的注释基因能够显著聚类在与肌动蛋白丝组装等相关通路上。超声20 min相比10 min,非启动子区EZH2新增基因的GO (Gene ontology)聚类通路要远多于丢失基因,且超声30 min相比20 min,非启动子区丢失基因的GO聚类通路要远多于新增基因,这些通路大多与RNA聚合酶Ⅱ (RNA polymerase Ⅱ,RNAPII)、器官发育、细胞形态发生相关。这表明超声时间不足或过长均会导致EZH2的基因组定位信息的不全。另外,超声主要影响启动子区中的PRC2非结合区域及二价启动子区域的EZH2结合位点,还影响非启动子区中PRC2结合区域、PRC2不结合区域以及活化态增强子区域的EZH2结合位点。综上,建议对大分子量的染色质修饰相关蛋白优化超声处理时间,使形成的染色质片段聚集在100–500 bp可获得比较全面的基因组信息。对小分子量的组蛋白来说,超声时间对ChIP-seq结果影响不大。
关键词超声时间    染色质片段化    EZH2    PRC2    启动子    增强子    
Effect of sonication on results of ChIP-seq experiments involving PRC2 related proteins
Gensheng Yang1 , Fangfang Jiao1 , Ruitu Lü1 , Rui Guo1,2     
1. Institutes of Biomedical Sciences, Fudan University, Shanghai 200031, China;
2. Department of Oncology, Pudong Medical Center, Fudan University, Shanghai 201399, China
Abstract: Sonication is one of the essential strategies of chromatin fragmentation in Chromatin immunoprecipitation (ChIP) assay. The impact of proteins with different molecular weights generated under different duration of sonication on the results of Chromatin immunoprecipitation sequencing (ChIP-seq) experiments involving the Polycomb Repressive Complex 2 (PRC2) related protein EZH2, which is a histone methyltransferase, and its product H3K27me3 was investigated. The results indicate that in the promoter region or nonpromoter region, there were hardly any differences among the H3K27me3 peaks annotated genes from different duration of sonication, which suggesting that the duration of sonication had little effect on histone ChIP-seq results. In contrast, in the promoter region newly gained EZH2 peaks annonated genes at 20 min sonication time were significantly clustered in the gene ontology (GO) pathways related to actin filament bundle compared with 10 min. In the nonpromoter region, compared with 10 min, the GO pathways of newly gained EZH2 peaks annonated genes at 20 min sonication time is much more than that of lost EZH2 peaks annonated genes. And in the nonpromoter region, compared with 20 min, the GO pathways of lost EZH2 peaks annonated genes at 30 min sonication time is much more than that of newly gained EZH2 peaks annonated genes. Most of these pathways are associated with RNA polymerase II (RNAPII), organ development and cell morphogenesis. These suggest that the genomic information of EZH2 will be lost if the duration of sonication is not enough or too long. Different duration of sonication mainly affect the EZH2 peaks in PRC2 unoccupied region and the bivalent promoter in the promoter region, as well as the PRC2 occupied region, PRC2 unoccupied region and the activated enhancer in the nonpromoter region. Therefore, the sonication for the chromatin related proteins with high molecular weights need to be optimized to make chromatin fragments size vary from 100 bp to 500 bp, which will yield relatively comprehensive genomic information of the target protein. For histones, which are of small molecular weights, duration of sonication has little effect on them.
Keywords: duration of sonication    fragmentation of chromatin    EZH2    PRC2    promoter    enhancer    

染色质免疫共沉淀是目前表观遗传学及分子生物学的研究手段之一,可以分析蛋白质和DNA在天然染色质环境中的相互作用[1]。将ChIP实验与二代高通量测序结合,探究目的蛋白在基因组上分布情况的技术称为染色质免疫共沉淀测序(Chromatin immunoprecipitation sequencing,ChIP-seq)[2]。ChIP-seq技术主要用于研究目的蛋白(例如表观遗传修饰的组蛋白、染色质修饰蛋白、转录因子、辅因子及其他染色质相关蛋白)在基因组上的定位及富集分析。ChIP-seq实验的主要流程包括:1)交联,通过甲醛处理等方法将染色质上的DNA与目的蛋白交联;2)染色质片段化,运用超声或酶解的方法将染色质片段化;3)蛋白质免疫沉淀,将结合了目的蛋白的染色质片段通过抗体进行富集纯化;4)解交联,通过加热等方式解除DNA与目的蛋白的交联;5) DNA纯化,添加蛋白酶(Protease)和核糖核酸酶(RNase)酶解消化去除解交联产生的蛋白和RNA,用PCR回收试剂盒纯化与目的蛋白结合的DNA[3];6)建库并进行二代测序。对ChIP-seq影响最大的环节为染色质片段化和蛋白质免疫沉淀,这两步都需要根据具体研究的蛋白去调整实验条件,本文就针对染色质片段化环节进行讨论。

染色质片段化主要有超声和酶解两种方式。对于酶解法来说,目前主要采用微球菌核酸酶(Micrococcal nuclease,MNase)或商业试剂盒中的混合酶。酶解法的优点在于比超声更加温和,对蛋白与DNA以及蛋白与蛋白之间的相互作用影响更小,但仍存在很多问题,例如酶解主要消化核小体之间的连接DNA,所以只能形成整数倍核小体长度的染色质片段,且大多数为一个核小体长度,这样不仅会丢失一些结合在连接DNA区域的转录因子的信息,而且还会降低一些横跨多个核小体长度的染色质结合蛋白的富集度。另外较小的消化片段会使qPCR验证更加困难,酶切温度37 ℃会影响蛋白表位,从而降低免疫沉淀效率等[4]。因此,目前ChIP实验采用的最主流的染色质片段化方式仍然为超声破碎。超声主要受到细胞类型、细胞密度、ChIP裂解缓冲液、超声时间以及目的蛋白种类5个因素影响。一般使细胞密度低于107个/mL进行超声,对于第一次进行ChIP实验的蛋白,一般会使用较温和的裂解缓冲液(含0.1% SDS),实验过程中控制染色质片段化程度最常用方法是调节超声时间的长短。超声时间越长,染色质片段化程度越高,但时间过长超声波可能会破坏目的蛋白- DNA之间的相互作用以及蛋白的稳定性,反之超声时间越短,染色质片段化会不彻底,染色质中不易打开的部分会形成较长的染色质片段,这会导致距离目的蛋白实际基因组定位很远的位点也被认为有目的蛋白的富集,从而导致ChIP-seq的分辨率大大降低。目前一般认为超声片段分布在100−1 000 bp范围内为宜,最好集中分布在500 bp以内,即大约3个核小体长度以内[2, 4-5]。过长的染色质片段会在建库的过程中通过切胶回收的方式去除。

为了研究不同分子量蛋白在不同超声时间对ChIP-seq数据的影响,选取表观遗传领域已研究较多的PRC2相关蛋白EZH2 (分子量为85 kDa)和其催化生成的K27位具有三甲基化修饰的组蛋白H3K27me3 (分子量为17 kDa)为例进行探讨。EZH2作为PRC2的催化亚基,是一个含有SET结构域的组蛋白甲基转移酶(Histone methyltransferase),能够甲基化组蛋白H3K27[6-8]。PRC2能够与组蛋白去乙酰化酶HDACs互作将乙酰化转变为甲基化从而抑制基因表达[9],PRC2在一些发育调节基因的启动子上形成H3K27me3起到转录抑制作用[10-14]。PRC2催化生成H3K27me3后还可招募多梳抑制复合物1 (Polycomb repressive complex 1, PRC1)泛素化H2AK119从而保持基因的抑制[15]。EZH2参与胚胎发育、干细胞干性维持以及造血细胞增殖并起到抑制或沉默基因表达的作用。在慢性淋巴细胞性白血病、前列腺癌、胃癌、胶质瘤、乳腺癌等多种癌症中EZH2呈现高表达,而且EZH2的高表达对肿瘤的发生、增殖、侵袭和转移均有促进作用[16-17]。有研究表明EZH2可不依赖于PRC2独立行使转录激活因子的功能,例如在乳腺癌中EZH2不依赖于PRC2作为转录激活因子激活NF-κB靶基因从而促进乳腺癌的发展[9, 18]。由此可见,目前对EZH2和H3K27me3染色质调节机制研究比较广泛,可供参考的ChIP-seq数据和信息较多,因此可选择这两个蛋白为代表来量化不同程度的染色质片段化对目的蛋白ChIP-seq数据的影响。使用相同的细胞数、不同的超声时间对以H3K27me3为代表的组蛋白和以EZH2为代表的染色质修饰蛋白进行ChIP-seq实验,在相同的测序深度下进行数据分析,探究能够产生最全面ChIP-seq数据信息的超声条件。

1 材料与方法 1.1 材料 1.1.1 耗材及试剂

胎牛血清FBS、MEM非必需氨基酸NEAA、β-巯基乙醇购自Gibco公司;DMEM高糖培养基、双抗(氨苄青霉素和链霉素)、磷酸盐缓冲液(PBS)、0.25%胰酶为Hyclone公司产品;明胶(Gelatin)、脱氧胆酸钠(Na-deoxylcholate)、二硫苏糖醇(DTT)、苯甲基磺酰氟(PMSF)、多聚甲醛、乙基苯基聚乙二醇(NP-40)、乙二胺四乙酸(EDTA)、无EDTA的蛋白酶抑制剂混合物(EDTA-free protease inhibitor cocktail)为Sigma公司产品;LIF购自Millipore公司;Hepes、Tris、Triton X-100、SDS购自Amresco公司;PCR产物回收试剂盒购自Qiagen公司;NaCl、LiCl购自国药集团;RNase A购自Thermo公司;Proteinase K为TaKaRa公司产品;免疫磁珠Dynabeads protein A/G购自Invitrogen公司;KAPA Hyper文库构建试剂盒购自罗氏公司;H3K27me3兔源单抗、Tri-Methyl-Histone H3 (Lys27) (C36B11) Rabbit mAb购自CST公司;EZH2兔源单抗、Ezh2 (D2C9) Rabbit mAb购自CST公司。

1.1.2 仪器设备

细胞超净台、细胞培养箱购自Thermo公司;QSONICA超声波破碎仪为Misonix公司产品;脱色摇床购自其林贝尔仪器制造有限公司;恒温振荡仪ThermoMixer为Eppendorf公司产品;DynaMag-2磁力架购自Life Technologies公司。

1.2 方法 1.2.1 小鼠胚胎干细胞培养

用适量含0.1%明胶(Gelatin)的灭菌水溶液铺满细胞培养皿,室温放置30 min以上。吸除盛有细胞的培养基,PBS清洗。0.05%胰酶消化约3 min后加入3 mL新鲜的小鼠胚胎干细胞培养基(DMEM高糖培养基,10% FBS,1%双抗,1% NEAA,0.1% β-ME,1 000 U/mL LIF)重悬,离心去上清。吸除Gelatin,按需要的细胞量加入胰酶消化后重选的细胞悬液及新鲜培养基,轻轻摇匀,放入37 ℃、5% CO2浓度的细胞培养箱中。小鼠胚胎干细胞生长速度很快,一天传两代,故一般按照1﹕10隔天进行传代培养。

1.2.2 交联

向盛有约6×106细胞数量的6 cm细胞培养皿中加入终浓度为1%的多聚甲醛(4 mL培养基加入37%多聚甲醛108 μL),在室温脱色摇床上缓慢转动进行蛋白质与DNA的固定,10 min后加入2.5 mol/L的甘氨酸溶液200 μL终止交联,反应5 min后吸除上清并用预冷的PBS清洗2次,加入PBS刮下细胞。

1.2.3 超声

用1 mL ChIP裂解缓冲液(ChIP lysis buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0),1% Triton X-100,0.1% Na-deoxylcholate,0.1% SDS,0.1% DTT,1 mmol/L PMSF,2% EDTA-free Protease Inhibitor Cocktail)重悬细胞放入QSONICA超声仪中进行超声处理。将细胞超声破碎液13 000 r/min离心10 min,取2%体积(20 μL)上清作为Input检查超声情况,剩下的上清冻于−80 ℃或放置冰上待超声情况检测结束之后使用。

1.2.4 解交联

向Input中加入5倍体积(100 μL)的ChIP洗脱缓冲液(ChIP Wash Buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0),1% Triton X-100,0.1% Na-deoxylcholate),放入65 ℃的恒温振荡仪(ThermoMixer) 4 h以上解交联。

1.2.5 消化RNA和蛋白质

加入等体积(120 μL)无NaCl的ChIP TE缓冲液(ChIP TE Buffer without NaCl:50 mmol/L Tris-HCl (pH 8.0),10 mmol/L EDTA (pH8.0))以及4 μL RNase A,4 μL ChIP蛋白酶K消化缓冲液(ChIP proteinase K digest buffer:300 mmol/L CaCl2,100 mmol/L Tris-HCl (pH 8.0))以及4 μL Proteinase K放入50 ℃的恒温振荡仪上消化1 h。

1.2.6 DNA纯化与超声检测

用Qiagen PCR产物回收试剂盒纯化Input中的DNA,取1% Input跑胶(2%的琼脂糖凝胶)检测超声情况,剩下1% Input作为ChIP的阴性对照。

1.2.7 免疫沉淀

检测超声片段处于预期范围内后,向剩余的超声破碎液中加入等体积的ChIP稀释缓冲液(ChIP Dilution Buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0)),目的是将SDS等去垢剂浓度降低1倍以创造温和的结合条件,再加入目的蛋白的抗体进行蛋白质免疫沉淀,放入4 ℃旋转培养器中孵育4 h以上或过夜。再加入免疫磁珠Dynabeads protein A/G各30 μL继续4 ℃孵育2 h。在DynaMag-2磁力架上用预冷的ChIP洗涤缓冲液(ChIP Wash Buffer:50 mmol/L Hepes (pH 7.5),500 mmol/L NaCl,1 mmol/L EDTA (pH 8.0),1% Triton X-100,0.1% Na-deoxylcholate),ChIP RIPA缓冲液(ChIP RIPA buffer:50 mmol/L Hepes (pH 7.5),300 mmol/L LiCl,1 mmol/L EDTA,0.5% NP-40,0.7% Na-deoxylcholate),以及ChIP TE缓冲液(ChIP TE buffer:50 mmol/L Tris-HCl (pH 8.0),10 mmol/L EDTA (pH8.0),50 mmol/L NaCl)洗磁珠(Beads),次数分别为3,3,1。加入100 μL ChIP Elution Buffer,后续解交联、消化RNA和蛋白、DNA纯化步骤参考前面对Input操作的流程。

1.2.8 qPCR验证并进行建库

检测ChIP的成功主要手段并非测量ChIP得到的DNA总量的大小,而是需要经过qPCR计算目的蛋白在基因组阳性区域相对阴性区域的富集度来衡量。ChIP得到的DNA总量中有很多属于背景DNA故不应作为判断ChIP好坏的标准,一般目的蛋白阳性区域相比阴性区域的富集度低于4倍认为ChIP没有成功。将纯化得到的DNA按照KAPA Hyper文库构建试剂盒建库并进行二代测序。

1.2.9 ChIP-seq生物信息学分析

用Trim galore (version 0.5.0)进行数据清洗;用Bowtie2 (version 2.4.3.3)进行比对;用Samtools (version 1.6)进行排序和去重;用macs2 (version 2.1.1)识别峰(callpeak);用Deeptools (version 3.2.0)绘制目的蛋白基因组平均密度分布图以及相关性散点图;用R包ChIPseeker (version 1.16.1)对peaks注释和可视化[19];用R包Eulerr (version 5.1.0)进行venn图绘制;用R包ClusterProfiler (version 3.8.1)进行GO富集分析[20]

2 结果与分析 2.1 超声时间对染色质片段化的影响

使用细胞数为6×106的小鼠胚胎干细胞进行甲醛交联并裂解,分别超声10 min、20 min、30 min处理。超声后纯化染色质得到DNA片段大小随超声时间延长而变化(图 1)。超声10 min所得DNA在100–2 000 bp之间均匀分布;超声20 min所得DNA在100–2 000 bp之间分布,但在100–500 bp富集较多;30 min超声所得DNA主要富集在100–300 bp之间。可以看出超声时间对染色质片段化后的DNA大小影响较大。

图 1 不同超声时间下染色质片段凝胶电泳图 Fig. 1 Agarose gel electrophoresis for chromatin fragment from different duration of sonication.
2.2 超声对组蛋白修饰染色质富集的影响

对2×106个小鼠胚胎干细胞在超声10 min、20 min和30 min时分别进行H3K27me3的ChIP-seq实验,得到H3K27me3基因组结合位点分别为16 348、16 837、19 443个,结合位点随超声时间增加而增加。对H3K27me3结合位点在基因组各类区域分布情况进行分析,结果(图 2A)显示3种超声时间条件得到的基因组结合位点在基因组各区域的分布相差不大,超声30 min相比20 min在启动子区H3K27me3的结合位点分布占比略有降低,基因间隔区略有升高。H3K27me3结合位点在全基因组上的平均密度分布分析显示,超声时间对H3K27me3平均密度分布无显著影响(图 2B),且可看出H3K27me3主要富集在启动子区域,这提示H3K27me3在启动子区和非启动子区的功能具有差异,故后续对启动子区和非启动子区分别进行分析。

图 2 超声对H3K27me3 ChIP-seq的影响 Fig. 2 The effect of sonication on H3K27me3 ChIP-seq. (A) Genomic distribution of H3K27me3 ChIP-seq peaks in mESCs. (B) Average genome-wide occupancies of H3K27me3 along the transcription unit. The gene body length is aligned by percentage from the TSS to TTS. Three kilobases upstream of TSS and 3 kb downstream of TTS are also included. (C) Venn diagram showing H3K27me3 peaks annonated genes from different duration of sonication in promoter region. (D) Venn diagram showing H3K27me3 peaks annonated genes from different duration of sonication in nonpromoter region. (E) GO enrichment analysis comparation (P < 0.01): H3K27me3_10, H3K27me3_20, H3K27me3_30 represents the H3K27me3 peaks annonated genes at 10 min, 20 min and 30 min sonication time; 20_Lost_promoter means the lost H3K27me3 peaks annonated genes in promoter region after prolonged sonication from 10 min to 20 min; 20_New_promoter means the newly gained H3K27me3 peaks annonated genes in promoter region after prolonged sonication from 10 min to 20 min; 30_Lost_promoter means the lost H3K27me3 peaks annonated genes in promoter region after prolonged sonication from 20 min to 30 min; 30_New_promoter means the newly gained H3K27me3 peaks annonated genes in promoter region after prolonged sonication from 20 min to 30 min. (F) Chromatin accessibility of H3K27me3 peaks from different duration of sonication. (G) Genome-browser view of H3K27me3 ChIP-seq peaks from different time duration of sonication.

由于不重叠但位置相近的基因组结合位点的注释基因可能相同,所以结合位点之间的重叠情况不能准确反映不同超声时间下的真实差异。因此将H3K27me3基因组结合位点注释到最邻近基因上,得到启动子区不同超声时间下H3K27me3结合位点注释基因数为4 060、4 075、4 294个(图 2C),非启动子区基因数为4 751、4 690、5 247个(图 2D)。由不同超声时间下注释基因的韦恩重叠分析可发现启动子区基因重叠比例高于非启动子区,这提示超声对启动子区域的影响相比非启动子区要小(图 2C–D)。将不同超声时间下H3K27me3的基因组结合位点注释基因进行GO聚类分析,结果显示超声时间10 min、20 min、30 min得到的GO通路数量分别为1 479、1 539、1 506 (P < 0.01),且最显著富集的前10条通路与已报道文献一致能够显著富集在轴突发育(Axon development)、细胞命运决定(Cell fate commitment)、胚胎器官发育(Embryonic organ development)等H3K27me3主要相关功能的通路上(图 2E)[21-23]。随着超声时间延长,除了非启动子区域20 min相比10 min的新增基因有一条显著富集的通路外,其他区域均未显著富集。图 2F表示不同超声时间得到的H3K27me3基因组结合位点的染色质开放程度的比较,由小提琴箱式图可看出启动子区与非启动子区中不同超声时间对H3K27me3基因组结合位点的染色质开放程度几乎没有影响,同时可看到启动子区的H3K27me3的开放程度大于非启动子区。图 2G可直观地看到不同超声时间下H3K27me3的基因组结合位点几乎没有差异。

综上所述,在启动子区或非启动子区,不同时间超声处理得到组蛋白H3K27me3结合位点的注释基因及染色质开放程度均无明显差异,且超声时间对H3K27me3在基因组各区域分布情况以及平均分布密度影响不大。

2.3 超声对非组蛋白染色质富集的影响

为了研究超声时间对不同分子量蛋白的影响,使用不同超声时间处理的6×106个小鼠胚胎干细胞对较大分子量的非组蛋白EZH2进行ChIP-seq实验,与较小分子量的组蛋白H3K27me3进行对比分析。EZH2作为PRC2的组分,是H3K27的甲基转移酶,分子量约85 kDa。ChIP-seq分析结果显示超声10 min、20 min和30 min分别得到EZH2基因组结合位点数为7 334、7 890、7 789。随着超声时间延长,分布在基因组各区域的EZH2结合位点的比例波动不大(图 3A)。EZH2结合位点在全基因组上的平均密度分布分析显示,超声时间对平均密度分布无明显影响(图 3B)。

图 3 超声对EZH2 ChIP-seq的影响 Fig. 3 The effect of sonication on EZH2 ChIP-seq. (A) Genomic distribution of EZH2 ChIP-seq peaks in mESCs. (B) Average genome-wide occupancies of EZH2 along the transcription unit. The gene body length is aligned by percentage from the TSS to TTS. Three kilobases upstream of TSS and 3 kb downstream of TTS are also included. (C) Venn diagram showing EZH2 peaks annonated genes from different duration of sonication in promoter region. (D) Venn diagram showing EZH2 peaks annonated genes from different duration of sonication in nonpromoter region. (E) GO enrichment analysis comparation (P < 0.01): EZH2_10, EZH2_20, EZH2_30 represents the EZH2 peaks annonated genes at 10 min, 20 min and 30 min sonication time; 20_Lost_promoter means the lost EZH2 peaks annonated genes in promoter region after prolonged sonication from 10 min to 20 min; 20_New_promoter means the newly gained EZH2 peaks annonated genes in promoter region after prolonged sonication from 10 min to 20 min; 30_Lost_promoter means the lost EZH2 peaks annonated genes in promoter region after prolonged sonication from 20min to 30min; 30_New_promoter means the newly gained EZH2 peaks annonated genes in promoter region after prolonged sonication from 20 min to 30 min. (F) Chromatin accessibility of EZH2 peaks from different duration of sonication. (G) Genome-browser view of EZH2 ChIP-seq peaks from different time duration of sonication.

启动子区不同超声时间下EZH2结合位点的注释基因数为4 320、4 624、4 545个(图 3C),非启动子区注释基因数为2 127、2 255、2 207个(图 3D)。由韦恩重叠分析可发现启动子区基因重叠比例高于非启动子区,这提示与H3K27me3类似,超声对EZH2启动子区域的影响相比非启动子区也小(图 3C–D)。将不同超声时间条件下EZH2基因组结合位点注释基因进行GO聚类分析,结果表明超声时间10 min、20 min、30 min得到的GO通路数分别为2 604、2 727、2 672 (P < 0.01),且最显著富集的前10条通路与已报道文献一致,能够显著富集在分化发育等EZH2主要相关功能的通路上,例如轴突发育(Axon development)、胚胎器官发育(Embryonic organ development)、细胞命运决定(Cell fate commitment)[24-25]。在启动子区超声20 min相比10 min新增的EZH2结合位点注释基因富集在4条GO通路上,例如肌动蛋白丝成束(Actin filament bundle)、应力纤维(Stress fiber)等通路上,启动子区其他部分均无显著富集。

对于非启动子区,超声20 min相比10 min新增基因的富集通路(113条)远多于丢失基因富集的通路(8条),30 min比20 min丢失基因富集的通路(149条)也远多于新增基因富集的通路(17条),在前20条最显著富集的通路中仍然是非启动子区20 min相比10 min新增的通路多于丢失,非启动子区30 min丢失的通路多于新增,且这些通路主要与RNAPII、器官发育、细胞形态发生和细胞分化相关(图 3E)。这表明超声时间不足(10 min)或超声时间过长(30 min)均会造成得到的EZH2基因组结合信息不全。图 3F表示不同超声时间得到的EZH2基因组结合位点的染色质开放程度的比较,由小提琴箱式图可看出启动子区不同超声时间对EZH2基因组结合位点的染色质开放程度几乎没有影响,但超声20 min和30 min相比10 min,EZH2基因组结合位点的染色质开放程度均发生下降,这提示超声时间延长可能打开了更多的染色质开放程度低的区域,即染色质致密不易被超声破碎的部分。图 3G可直观地看到不同超声时间下EZH2的基因组结合位点存在差异。

综上,虽然超声时间对非组蛋白EZH2在基因组各区域分布情况以及平均分布密度影响不大,但相比H3K27me3,EZH2 ChIP-seq数据受超声时间影响较大。而且超声对非启动子区的影响大于启动子区。相比10 min和30 min,超声20 min即超声片段集中分布在100–500 bp时,能够拿到更全面的EZH2基因组结合信息。

2.4 EZH2随超声时间延长丢失和新增基因组结合位点的具体定位

由上一节的分析结果可知20 min为最优的超声条件,选取超声20 min相比10 min启动子区新增的EZH2基因组结合位点、超声20 min相比10 min非启动子区新增的EZH2基因组结合位点以及30 min相比20 min非启动子区丢失的EZH2基因组结合位点这3部分为代表探究超声时间具体影响了基因组的哪些区域。

SUZ12和EED是EZH2行使催化功能所必需的两个非催化亚基[9],EZH2和SUZ12及EED三者共定位的基因组结合位点可认为是PRC2的结合区域。EZH2除了作为表观遗传书写器(Writer),依赖PRC2起到转录抑制的作用外,还被报道在多种癌症中能够不依赖于PRC2作为转录激活因子独立行使转录激活功能[9, 18]。故可分析超声时间影响了基因组上PRC2结合区域还是PRC2不结合区域的EZH2结合位点。另外对于启动子区和非启动子区还可进一步细分,启动子区依据组蛋白修饰可划分为H3K4me3和H3K27me3共定位的二价启动子(Bivalent promoter)、只有H3K4me3而没有H3K27me3的活跃启动子(Active promoter)、只有H3K27me3而没有H3K4me3的抑制启动子区(Repressed promoter)[26],非启动子区最主要的特征就是散布着增强子,根据组蛋白修饰可分为具有H3K4me1和H3K27ac的活化态增强子(Active enhancer)、只有H3K4me1的待发态增强子(Primed enhancer)以及具有H3K4me1和H3K27me3的准备态增强子(Poised enhancer),也可称为静态增强子[27]。故还可以分析不同超声时间影响了哪一类启动子或增强子区域的EZH2结合位点。

对启动子区中的PRC2结合区域、PRC2不结合区域、二价启动子区、活跃启动子区、抑制启动子区的20 min新增EZH2结合位点进行spearman相关分析和GO聚类比较分析(P < 0.05),发现启动子区20 min新增的EZH2基因组结合位点主要分布在PRC2不结合区域及二价启动子区域(图 4A–B)。对非启动子区中PRC2结合区域、PRC2不结合区域、活化态增强子、待发态增强子、准备态增强子区的20 min新增EZH2结合位点和30 min丢失EZH2结合位点的进行spearman相关分析和GO聚类比较分析(P < 0.05)发现,非启动子区随超声时间延长丢失和新增的EZH2基因组结合位点主要不仅分布在PRC2结合区域、而且也分布在PRC2不结合区域以及活化态增强子上(图 4C–E)。

图 4 EZH2随超声时间延长丢失和新增基因组结合位点的具体定位区域 Fig. 4 EZH2 lost and newly gained peaks in specific genomic regions after prolonged sonication. (A–B) Scatterplot of correlations and GO enrichment analysis (P < 0.05) of the EZH2 peaks in 20_New_promoter, PRC2 occupied region, PRC2 unoccupied region, Bivalen promoter, active promoter, repressed promoter. (C–E) Scatterplot of correlations and GO enrichment analysis (P < 0.05) of the EZH2 peaks in 20_New_nonpromoter, 30_Lost_nonpromoter, PRC2 occupied region, PRC2 unoccupied region, Active ehancer, Primed enhancer, Poised enhancer.
3 讨论

ChIP-seq实验中超声时间延长会得到更多小分子量的染色质DNA片段,但是也会伴随产热,对蛋白质稳定性有影响。本研究以组蛋白H3K27me3和其甲基化转移酶EZH2为例,研究不同超声时间对不同分子量大小蛋白ChIP-seq的影响。对小分子量组蛋白H3K27me3,在启动子区或非启动子区不同超声时间得到的基因组结合位点的注释基因无明显差异。较短超声时间虽然产生100–500 bp DNA片段比例较少,但是对于小分子量组蛋白,足够得到比较全面的基因组结合位点信息,延长时间超声并不能显著增加基因组结合位点信息。

与组蛋白不同,将超声时间从10 min延长至20 min后,启动子区新增EZH2的基因组结合位点注释基因能够显著(P < 0.01)聚类在与肌动蛋白丝组装的相关通路上(图 3E),而且新增的EZH2基因组结合位点主要分布在PRC2不结合区域及二价启动子区域,因为这两个区域的EZH2结合位点注释基因也显著(P < 0.05)聚类在肌动蛋白丝组装等相关通路上(图 4E)。有研究表明在T细胞和纤维母细胞中敲除EZH2会导致聚合的F-actin降低,提示EZH2可以促进G-actin组装聚合为F-actin,即EZH2对肌动蛋白丝的组装起到促进作用[28-29]。而基因组上PRC2不结合区域的EZH2可能具有转录激活作用,这提示EZH2可能以不依赖PRC2的方式作为转录激活因子促进胚胎干细胞中肌动蛋白丝的组装。若超声时间不足,则会丢失EZH2调节肌动蛋白丝这部分信息。另外非启动子区20 min新增基因的聚类(113条)要远多于丢失基因(8条),非启动子区30 min丢失基因的聚类(149条)要远多于新增基因(17条),且这些区域大多显著(P < 0.01)聚类在RNAPII、器官发育、细胞形态发生相关通路上(图 3E)。这表明超声时间不足或过长均会丢失EZH2的基因组定位信息且超声对非启动子区的影响要大于启动子区。进一步分析还发现超声主要影响非启动子区中PRC2结合区域、PRC2不结合区域以及活化态增强子区域的EZH2结合位点,因为这些区域的EZH2结合位点注释基因也能显著(P < 0.05)富集在RNAPII、器官发育、细胞形态发生等相关通路上(图 4E)。

综上所述,超声步骤对于染色质免疫沉淀测序实验非常重要,建议对大分子量的染色质修饰相关蛋白优化超声处理时间,使形成的染色质片段聚集在100–500 bp可获得比较全面的基因组信息。对小分子量的组蛋白来说,超声时间对其影响不大。

参考文献
[1]
Kuo MH, Allis CD. In vivo cross-linking and immunoprecipitation for studying dynamic protein: DNA associations in a chromatin environment. Methods, 1999, 19(3): 425-433. DOI:10.1006/meth.1999.0879
[2]
Mardis ER. ChIP-seq: welcome to the new frontier. Nat Methods, 2007, 4(8): 613-614. DOI:10.1038/nmeth0807-613
[3]
Das PM, Ramachandran K, Vanwert J, et al. Chromatin immunoprecipitation assay. Biotechniques, 2004, 37(6): 961-969. DOI:10.2144/04376RV01
[4]
Skene PJ, Henikoff S. A simple method for generating high-resolution maps of genome-wide protein binding. eLife, 2015, 4: e09225. DOI:10.7554/eLife.09225
[5]
Schmid CD, Bucher P. ChIP-seq data reveal nucleosome architecture of human promoters. Cell, 2007, 131(5): 831-832. DOI:10.1016/j.cell.2007.11.017
[6]
Nekrasov M, Wild B, Müller J. Nucleosome binding and histone methyltransferase activity of Drosophila PRC2. Embo Rep, 2005, 6(4): 348-353. DOI:10.1038/sj.embor.7400376
[7]
Tie F, Stratton CA, Kurzhals RL, et al. The N terminus of Drosophila ESC binds directly to histone H3 and is required for E(Z)-dependent trimethylation of H3 lysine 27. Mol Cell Biol, 2007, 27(6): 2014-2026. DOI:10.1128/MCB.01822-06
[8]
Højfeldt JW, Laugesen A, Willumsen BM, et al. Accurate H3K27 methylation can be established de novo by SUZ12-directed PRC2. Nat Struct Mol Biol, 2018, 25(3): 225-232.
[9]
Tan JZ, Yan Y, Wang XX, et al. EZH2: biology, disease, and structure-based drug discovery. Acta Pharmacol Sin, 2014, 35(2): 161-174. DOI:10.1038/aps.2013.161
[10]
Margueron R, Reinberg D. The polycomb complex PRC2 and its mark in life. Nature, 2011, 469(7330): 343-349. DOI:10.1038/nature09784
[11]
Simon JA, Kingston RE. Occupying chromatin: Polycomb mechanisms for getting to genomic targets, stopping transcriptional traffic, and staying put. Mol Cell, 2013, 49(5): 808-824. DOI:10.1016/j.molcel.2013.02.013
[12]
Chamberlain SJ, Yee D, Magnuson T. Polycomb repressive complex 2 is dispensable for maintenance of embryonic stem cell pluripotency. Stem Cells, 2008, 26(6): 1496-1505. DOI:10.1634/stemcells.2008-0102
[13]
Leeb M, Pasini D, Novatchkova M, et al. Polycomb complexes act redundantly to repress genomic repeats and genes. Gene Dev, 2010, 24(3): 265-276. DOI:10.1101/gad.544410
[14]
Riising EM, Comet I, Leblanc B, et al. Gene silencing triggers polycomb repressive complex 2 recruitment to CpG islands genome wide. Mol Cell, 2014, 55(3): 347-360. DOI:10.1016/j.molcel.2014.06.005
[15]
Kahn TG, Dorafshan E, Schultheis D, et al. Interdependence of PRC1 and PRC2 for recruitment to Polycomb Response Elements. Nucleic Acids Res, 2016, 44(21): 10132-10149.
[16]
Burdach S, Plehm S, Unland R, et al. Epigenetic maintenance of stemness and malignancy in peripheral neuroectodermal tumors by EZH2. Cell Cycle, 2009, 8(13): 1991-1996. DOI:10.4161/cc.8.13.8929
[17]
Jiang HM, Gupta R, Somma J. EZH2, a unique marker of malignancy in effusion cytology. Diagn Cytopathol, 2014, 42(2): 111-116. DOI:10.1002/dc.22999
[18]
Lee ST, Li ZM, Wu ZL, et al. Context-specific regulation of NF-κB target gene expression by EZH2 in breast cancers. Mol Cell, 2011, 43(5): 798-810. DOI:10.1016/j.molcel.2011.08.011
[19]
Yu GC, Wang LG, He QY. ChIPseeker: an R/Bioconductor package for ChIP peak annotation, comparison and visualization. Bioinformatics, 2015, 31(14): 2382-2383. DOI:10.1093/bioinformatics/btv145
[20]
Yu GC, Wang LG, Han YY, et al. Clusterprofiler: an R package for comparing biological themes among gene clusters. OMICS, 2012, 16(5): 284-287. DOI:10.1089/omi.2011.0118
[21]
Juan AH, Wang S, Ko KD, et al. Roles of H3K27me2 and H3K27me3 examined during fate specification of embryonic stem cells. Cell Rep, 2016, 17(5): 1369-1382. DOI:10.1016/j.celrep.2016.09.087
[22]
Liu JC, Wu XW, Zhang HY, et al. Dynamics of RNA polymerase Ⅱ pausing and bivalent histone H3 methylation during neuronal differentiation in brain development. Cell Rep, 2017, 20(6): 1307-1318. DOI:10.1016/j.celrep.2017.07.046
[23]
Khan AA, Ham SJ, Yen LN, et al. A novel role of metal response element binding transcription factor 2 at the hox gene cluster in the regulation of H3K27me3 by polycomb repressive complex 2. Oncotarget, 2018, 9(41): 26572-26585.
[24]
Collinson A, Collier AJ, Morgan NP, et al. Deletion of the polycomb-group protein EZH2 leads to compromised self-renewal and differentiation defects in human embryonic stem cells. Cell Rep, 2016, 17(10): 2700-2714. DOI:10.1016/j.celrep.2016.11.032
[25]
Thornton SR, Butty VL, Levine SS, et al. Polycomb repressive complex 2 regulates lineage fidelity during embryonic stem cell differentiation. PLoS ONE, 2014, 9(10): e110498. DOI:10.1371/journal.pone.0110498
[26]
Du Z, Li H, Wei Q, et al. Genome-wide analysis of histone modifications: H3K4me2, H3K4me3, H3K9ac, and H3K27ac in Oryza sativa L. Japonica. Mol Plant, 2013, 6(5): 1463-1472. DOI:10.1093/mp/sst018
[27]
Calo E, Wysocka J. Modification of enhancer chromatin: what, how, and why?. Mol Cell, 2013, 49(5): 825-837. DOI:10.1016/j.molcel.2013.01.038
[28]
Bryant RJ, Winder SJ, Cross SS, et al. The polycomb group protein EZH2 regulates actin polymerization in human prostate cancer cells. Prostate, 2008, 68(3): 255-263. DOI:10.1002/pros.20705
[29]
Su IH, Dobenecker MW, Dickinson E, et al. Polycomb group protein Ezh2 controls actin polymerization and cell signaling. Cell, 2005, 121(3): 425-436. DOI:10.1016/j.cell.2005.02.029