近日,南方科技大学生命科学学院植物与食品研究所翟继先副教授团队在Nature Plants在线发表了题为“An atlas of plant full-length RNA reveals tissue-specific and monocots-dicots conserved regulation of poly(A) tail length”的研究论文。该研究建立了包含拟南芥7个不同组织以及水稻、玉米、大豆等物种的带有Poly(A)信息的全长转录组数据库,总共捕获了超过120 million(M,百万)带有完整poly(A)尾信息的全长RNA分子(见图一)。该数据库能够在不同组织和不同物种的单基因水平对植物poly(A)尾进行全基因组表征研究。
Poly(A) 尾是真核生物 mRNA 的标志之一,在调节 mRNA 代谢和翻译中起重要作用。Poly(A)的长度受到Poly(A)聚合酶和去腺苷化酶的动态调控。近年来,Nanopore和PacBio等三代测序技术推进了全基因组水平Poly(A)尾的检测,但是目前植物mRNA poly(A)尾信息的资源仍相对匮乏。
图一 植物poly(A)尾图谱
翟继先团队前期基于Nanopore测序技术开发了一套对染色质结合的新生RNA进行全基因组水平全长测序的方法FLEP-seq,并用该方法发现拟南芥中存在广泛的转录后内含子剪接现象,细胞核中含有大量带有poly(A)但不完全剪接的mRNA。本研究中,作者优化了该方法,并将优化后的FLEP-seq2用于总RNA的研究。作者绘制了植物poly(A)图谱,包括了七种不同的拟南芥组织(幼苗、根、地上部分、叶、花序、种子、花粉)以及玉米、水稻、大豆的地上部分组织样品,每个样本有两个生物学重复(见图一)。研究人员总共构建了20个FLEP-seq2文库,捕获了包括121M poly(A)+ RNA在内的共276M RNA分子。
该研究发现植物poly(A)尾长度在~20 和 ~45 nt 处明显富集,表明它们大部分可能被一个或两个poly(A) 结合蛋白 (PABP)结合(见图一)。然而在花粉和种子中,poly(A)尾长度分布具有截然不同的模式,在较长的位置显著富集。例如,花粉中poly(A)长度分布峰值出现在55nt和80nt附近,这可能受花粉特异表达的PABP调控,并与花粉中mRNA稳定性相关。同时,该研究还发现poly(A)尾受到基因特异性的调控,半衰期短的mRNA一般具有较长的poly(A)尾,而半衰期长的mRNA的poly(A)尾较短,主要富集在45nt范围附近(见图二)。这些研究结果说明与PABP 结合的poly(A)尾对于mRNA稳定性至关重要。通过比较细胞核和细胞质的poly(A)长度发现,细胞核中的poly(A)尾比细胞质中的长,这说明出核的新生RNA的poly(A)尾经历了一个快速缩短的过程。进一步的多物种比较分析发现,植物直系同源基因的poly(A)尾的长度通常在物种间相对保守,这表明poly(A)尾长度受到自然选择的影响。此外,FLEP-seq2也可以与价格较昂贵的Pacific Biosciences (PacBio)长读长测序方法结合检测poly(A)尾内的非A碱基。该研究通过PacBio测序对两个拟南芥幼苗的FLEP-seq2文库进行测序,全基因组水平分析了植物poly(A)尾的核苷酸组成。结果表明,7%的植物poly(A)尾末端包含一个到多个U碱基,与前期研究一致,这些末端加U的poly(A)尾长度通常十分短,主要是10到20nt。
图二 不同mRNA半衰期基因的poly(A)尾长度分布。a,不同半衰期的基因的poly(A)尾长分布的热图。图中的每一行代表一个基因。b,不同半衰期的基因的poly(A)尾长度整体分布图。
总的来讲,该研究详细绘制了多物种多组织的植物poly(A)尾图谱,为进一步研究顺式元件和反式因子调控植物poly(A)尾长度,以及poly(A)长度调控基因表达的机制奠定了重要基础。
翟继先课题组研究助理教授贾津布和博士后陆文琴为该论文共同第一作者。山西大学裴雁曦教授合作参与了工作,翟继先为该论文的通讯作者。该研究得到了国家自然科学基金委员会、广东省创新创业团队、广东省普通高校植物细胞工厂分子设计重点实验室,以及深圳市科技创新委员会的资助。
论文链接:
https://www.nature.com/articles/s41477-022-01224-9
翟继先课题组主页链接:
供稿:生命科学学院
通讯员:付文卿