南科大翟继先团队发布包含两万多拟南芥公共RNA-seq文库的生物大数据在线分析平台
2020年08月14日 科研新闻

近日,南方科技大学生物系副教授翟继先课题组发布可以方便快速查询超过两万个公共RNA-seq文库的在线资源,相关成果以“A comprehensive online database for exploring ~20,000 public Arabidopsis RNA-Seq libraries”为题发表在植物学领域知名学术期刊《分子植物》(Molecular Plant)。

大图.jpg

过去十年,随着测序成本的降低和文库构建方法的发展,RNA-seq已成为继microarray之后研究基因表达的黄金标准。到目前为止,公共数据库释放的拟南芥相关的RNA-seq文库数目已经超过20000个。这些海量数据资源对研究基因的转录调控、组织特异性、胁迫处理以及不同发育阶段的基因表达是十分宝贵的资源。然而,如何高效地利用如此庞大的高通量测序数据资源,对于研究者来说是一个巨大的挑战,特别是在缺少编程基础的实验人员或者计算资源短缺的研究团队使用时。

翟继先课题组此次发布的数据库(Arabidopsis RNA-seq database, ARS)整合了来自GEO、SRA、ENA和DDBJ数据库的20,068个拟南芥RNA-seq数据,提供了“Google-style”在线查询工具。该研究对所有文库进行了基因表达水平定量和共表达网络分析,并将所有文库进行分类,总共涉及1176个突变体、1102种处理条件、12个组织和176个发育时期,同时也对突变体和处理条件分别同对应的对照组进行差异表达分析。

1.png

图1: 网页数据集与功能说明(上图),网站首页及部分button说明(下图)

为提高实验人员搜索海量数据的效率,ARS不仅支持基因的搜索,同时还提供文库、项目编号、关键字以及任意不同组合的查询方式。ARS具有快速查找基因表达量、组织特异性、突变体和处理响应的功能,并以多种图表返回搜索结果,同时支持下载搜索结果。用户可根据自己的需求在搜索前和搜索后对表格结果进行过滤,在画图区域单击获取相应文库的信息。此外,网站设置了online基因组浏览器(IGV),实验人员可更加便捷地查看每个文库的详细比对情况。为便于研究者之间快捷分享最新搜索结果,ARS提供了网页共享功能,并定期更新文库资源,研究者可通过共享按钮来共享相关搜索结果。

2.jpg

3.jpg

图2: 基因表达量结果展示(上图),IGV查看序列比对情况(下图)

课题组研究助理张洪、研究助理张飞、博士研究生于义溟为论文共同第一作者,翟继先为该论文的通讯作者,南科大为唯一通讯单位。生物系讲席教授郭红卫和研究助理教授李博生参与了本研究的部分工作。该研究得到了国家自然科学基金委员会、广东省创新创业团队、深圳市科技创新委员会的资助。

论文链接:https://www.cell.com/molecular-plant/fulltext/S1674-2052(20)30257-4

 

供稿:生物系

通讯员:付文卿

编辑:杨奂彦

主图设计:丘妍


推荐阅读
查看更多 >>
FOLLOW US @SOCIAL MEDIA
关注社交媒体上的我们
  • 国家安全部官方微信

  • 南方科技大学微信

  • 南方科技大学视频号

  • 南方科技大学抖音号

  • 南方科技大学快手号

  • 南方科技大学头条号

  • 南方科技大学南方+