人类的疾病和动植物的表型性状,都与其基因正确表达密切相关。但基因的表达不完全由DNA序列决定,而是同时与DNA调控元件的调控息息相关。近日,Molecular Plant《分子植物》在线发表了华中农业大学教授李国亮和李兴旺团队联合建立的整合水稻多元表观基因组数据的数据库,全面盘点了水稻基因转录调控的“零件库”。
论文共同通讯作者李国亮介绍,2003年提出并实施的人类ENCODE计划(DNA调控元件百科全书计划)通过整合DNA、RNA和表观修饰等多个层面的数据,建立了多组学的人类基因组DNA调控元件数据库,增强了人们对人类功能基因组的理解。同时,ENCODE计划的一系列技术和成果,为后续人类或模式生物基因调控的功能挖掘提供了极大的帮助和支持。
水稻是我国乃至世界重要的粮食作物,同时也是基础研究的重要模式植物。“水稻基因组DNA顺式调控元件的注释和鉴定,对理解水稻基因表达调控机理有重要意义。”论文共同通讯作者李兴旺说,因此,一个整合了水稻多元表观基因组数据的数据库,将极大方便研究人员查询和分析水稻的表观遗传信息,促进水稻表观和三维基因组研究。
图1. 水稻DNA调控元件数据库RiceENCODE的框架结构
图2. 水稻的染色质交互远程网络和浏览器截图
李国亮说,基因的正确表达,相当于一个机器的正常运行,需要各个零件的正常工作。而水稻基因表达涉及多少零件,以前的知识是零散的。
该数据库基于团队此前发表的水稻20个品系参考表观基因组图谱和水稻高分辨率三维基因组结构数据,收集了公开发表的水稻多品种多组织多维度的表观基因组信息,展示了水稻不同类型的染色质调控元件,立体地呈现了水稻品种和组织间复杂的基因表达调控关系。
“这是参照人类ENCODE计划、推进水稻功能基因组研究的重要一步。”李国亮说。
该数据库收集了共计972套水稻高通量组学数据,通过标准化数据处理流程,得到了多维度的高质量表观基因组和三维基因组数据。
研究者构建了综合的数据库搜索页面,用户可在数据库的基因组浏览器中查看不同品种、多种组织的表观基因组数据。用户可根据自己需求,选择不同类型的表观基因组数据,查询目标区域或目标基因的表观修饰信息。该数据库还提供了大量结果数据信息,这些数据文件都可在下载页面下载。用户可根据自己的需要进行下游分析。
另外,该数据库引入了水稻三维基因组数据。用户不仅可以查询目标区间参与的所有染色质远程交互信息,还可查询两两基因之间拥有的多层级交互基因网络,为水稻多基因之间共转录、共调控提供参考。
该数据库全面展示了多维度水稻表观基因组数据,涵盖了水稻不同品系不同组织间的表观基因组动态变化模式,为水稻功能基因组研究提供了解析水稻表观基因组和染色质远程互作信息的重要平台。
李兴旺说,该数据库相当于发布了水稻基因转录调控的“零件库”,方便大家在研究中选取合适的零件,组成基因表达的机器,正确表达相关基因。
点击左下角阅读原文,获取论文原文。
来源 |《中国科学报》 (2021-09-06 第4版 综合)
编辑 | 匡敏
校对 | 徐行 吴晗
转载请按以下格式注明来源↓↓↓
华中农业大学官方微信(微信号:hzau_news_center)