近日,南方科技大学生命科学学院副教授翟继先课题组使用基于Nanopore三代测序平台的Pore-C技术,解析了拟南芥基因组多位点相互作用及关联甲基化修饰,相关成果以“Pore-C Simultaneously Captures Genome-wide Multi-way Chromatin Interaction and Associated DNA Methylation Status in Arabidopsis”为题发表在国际知名学术期刊Plant Biotechnology Journal。
染色质捕获技术(Chromosome conformation capture)通过对染色质进行酶切和邻近连接得到的嵌合体序列进行测序,获得染色质互作信息,解析基因组的三维结构。其中,Hi-C和ChIA-PET技术在植物中的应用,为我们提供了丰富的植物基因组结构信息,解析了包括拟南芥、水稻、番茄、玉米等在内的多种植物的染色体互作图谱。然而,由于二代测序读长的限制以及其双端测序的特点,Hi-C和ChIA-PET技术只能提供染色体位点两两互作的信息(two-way interaction),而染色质多位点之间的互作信息 (multi-way interaction) 只能由多个细胞的两位点互作信息推理得出。由于细胞间的异质性,这种推论并不准确。另外,Hi-C和ChIA-PET技术包括了PCR扩增步骤,也无法保留序列上的表观修饰信息。其他捕获染色质多位点互作的技术,如SPRITE和ChIA-Drop,操作难度较大,难以在植物中应用推广。
Nanopore测序技术是一种长读长、单分子的测序技术。通过对过孔电流信号的解析,Nanopore可以读出平均长达30kb的碱基序列信息,并获得DNA分子上包括m5C, hm5C, and m6A在内的表观修饰信息。2019年,Ulahannan等人开发了Pore-C技术,使用Nanopore对染色质酶切、连接后形成的多片段嵌合体序列进行长读段测序,成功解析了哺乳动物细胞中的染色质多位点互作情况。
本研究在拟南芥中应用Pore-C技术,首次对植物基因组的多位点互作情况进行解析。相比起Hi-C实验流程,Pore-C的实验流程无需生物素标记、片段化、亲和纯化、DNA片段纯化等步骤,大大简化了实验操作步骤,建库流程可以在三天内完成(图1A)。研究人员使用拟南芥野生型幼苗构建了两个Pore-C文库,分别获得6.5 million(11.7Gb)和3.5 million(7.9Gb)高质量读段,N50长度分别为2654bp和3006bp。从这些文库中一共拆出50.7 million有效的成对互作。对比Hi-C文库,获得相当成对互作数量所需要的Pore-C测序读段数和测序碱基量都更少,证明Pore-C检测基因组互作的效率更高。此外,Pore-C的两个文库之间,以及Pore-C和Hi-C数据在检测拟南芥基因组互作时也有良好的一致性,说明该技术的可重复性和准确性较好(图1B,1C)。在拟南芥中,有44%的Pore-C读段能检测到多个基因组片段(图1D),和人细胞中Pore-C多位点互作读段比例相近(47%),对多位点互作的检测效率高于SPRITE技术。含基因组片段数越多的Pore-C片段,可以检测到更远基因组距离上的互作,这一特征有助于辅助基因组拼接(图1E)。
Pore-C在拟南芥中的应用,印证了在拟南芥基因组中存在多个KNOT ENGAGED ELEMENT (KEE)之间互作的推测。有超过1145条Pore-C读段检测到三个KEE之间的互作,并通过了统计学检验。其中,有一半的KEE多位点互作都和KEE3与KEE4相关联,说明KEE3和KEE4可能是KEE高维互作的核心区域(图1F)。另外,还有多条Pore-C读段检测到了4个KEE之间的互作(图1G)。Pore-C技术也检测到了拟南芥中多个端粒之间的互作,该现象也与之前Hi-C数据所推导出的结论相符。
本研究还解析了Pore-C数据中的甲基化修饰信息。研究人员使用甲基化修饰分析工具Deepsignal-plant解析了Pore-C片段中的CG, CHG, CHH的分布情况,得到的甲基化修饰信号与传统的全基因组亚硫酸氢盐测序(Whole genome bisulfite sequencing,WGBS)检测结果高度一致(图1H)。研究人员还使用Nanopolish解析了与互作信息关联的CG甲基化,发现空间距离较近的互作片段之间存在较高的甲基化水平关联性,这一规律与2019年任兵团队使用Methyl-HiC技术在小鼠胚胎干细胞(mESC)发现的规律相近(图1I)。
图1 Pore-C 捕获拟南芥基因组的多位点互作及DNA关联甲基化信息
A:Pore-C 实验流程示意图;B,C:Pore-C两个文库之间(B)以及Hi-C 和 Pore-C之间(C)互作矩阵比较;D:拟南芥Hi-C和Pore-C数据中单条读段上的互作DNA片段数(Contact Order)的分布比较;E:不同Contact Order组别的Pore-C读段中,互作频率在基因组距离上的分布;F:检测到至少三个不同KEE元件的Pore-C读段中的KEE组合分布;G:与KEE3,KEE4,KEE7,KEE8关联的Pore-C读段比对位置分布;H:Pore-C检测到的CG、CHG、CHH DNA 甲基化和WGBS甲基化结果比较;I:基因组距离25kb, 100kb, 1Mb的Pore-C互作片段之间CG甲基化水平的皮尔森相关系数(PCC)。
翟继先课题组博士研究生李卓雯、研究助理教授龙艳萍为共同第一作者,翟继先为该论文的通讯作者,南科大是论文第一单位。翟继先课题组博士研究生于义溟、刘智剑、莫伟鹏,硕士研究生张洪,研究助理教授贾津布也参与了本研究的部分工作;南科大生物系助理教授郑梅珍、研究助理教授田忠原指导了该研究。该研究得到了国家重点研发计划,广东省创新创业团队和深圳市科创委等项目的资助。
论文链接:https://onlinelibrary.wiley.com/doi/full/10.1111/pbi.13811
供稿:生命科学学院
文字:李卓雯
通讯员:付文卿
主图:丘妍
编辑:朱增光