位点|潜在位点难预测人工智能来帮忙


位点|潜在位点难预测人工智能来帮忙
文章图片
正常生长条件和45度热激处理36小时的水稻苗期表型 中国农科院生物所供图
基因组包括两类遗传信息——DNA序列遗传信息及表观遗传学信息 。后者涉及何时、何地以何种方式去应用遗传学信息 , 是作物农艺性状多样性的基础 。
近年来 , 表观遗传学成为生命科学热点领域 , 检测技术和高通量测序的发展推动了作物表观组学的研究 。然而 , 受到多种因素制约 , 仍有大量表观修饰位点没有得到发掘和研究 。
近日 , 中国农业科学院生物技术研究所谷晓峰课题组、田健课题组和普莉课题组在《新植物学家》(New Phytologist)上发表了最新研究成果 。他们构建了植物表观遗传修饰智能预测在线工具SMEP 。
该项工作利用人工智能 , 深度学习植物DNA甲基化、RNA甲基化、组蛋白修饰等序列信息 , 系统实现了水稻、玉米等物种中表观修饰位点的预测 , 为作物功能基因组研究和智能设计育种提供工具和数据支撑 。
真核生物基因转录的主要驱动力
谷晓峰告诉《中国科学报》 , 表观遗传修饰是指在基因的DNA序列没有发生改变的情况下 , 基因功能发生了可遗传的变化 , 并最终导致了表型的变化 。这些可遗传的表观修饰包括DNA甲基化修饰、RNA甲基化修饰、组蛋白修饰、非编码RNA、染色质重塑等 。
“表观遗传修饰是调控真核生物基因转录、RNA代谢以及其他生物过程的主要驱动因素 。”谷晓峰说 , 植物、动物等真核生物细胞正常功能的维持是DNA序列遗传、表观遗传这两种信息互相作用、保持平衡的结果 。“如果这两种因素的任何一种表达失衡 , 都有可能导致不正常的基因表达 , 不能形成正常的生长发育过程 。”
表观遗传在调控基因表达、RNA稳定性、蛋白质翻译等方面起着关键作用 , 参与作物产量、品质、抗逆等多个重要的生物学过程 。
普莉介绍 , 作为主要表观修饰类型之一 , 甲基化可以发生在DNA、RNA或组蛋白尾部序列上 , 且甲基化类型具有多样性 , 不同位置、不同类型的甲基化修饰对基因的表达具有激活或抑制作用 。
目前 , 以表观遗传学理论和技术为中心的精准表观育种打开了培育农作物全新路径的可能性 。普莉解释说 , 表观遗传修饰位点是指在DNA、RNA或者组蛋白序列上的甲基化、乙酰化等修饰位点 。
“解析作物的品质产量、广适应性和耐逆性等重要农艺性状的调控网络 , 鉴定重要的表观修饰位点 , 尤其是新的未知的修饰位点 , 可以为高产优质的作物新品种提供表观遗传基因资源、修饰位点等理论支持和技术支持 。”谷晓峰说 。
然而 , “由于表观遗传修饰在不同发育时期、不同生长环境等条件下具有动态可逆的调控特性 , 受到检测技术、实验成本、取材组织的限制 , 目前仍有大量重要的参与调控基因表达、生长发育等的表观修饰位点没有得到发掘和研究 。因此 , 如何利用现有表观遗传组学数据深入探索潜在的表观修饰位点是表观遗传研究面临的关键问题 。”田健说 。
人工智能生物技术成为关键
目前 , 科学家已经获得了一些作物的表观遗传组学大数据 。该用什么方法解析这些数据呢?
谷晓峰团队将目光投向了人工智能等信息科学的创新和应用 。人工智能驱动基因编辑、合成生物、全基因组选择等前沿生物技术快速发展 , 催生了人工智能和生物技术的深度融合 。这种深度融合产生的人工智能生物技术(AIbiotechnology)成为生物农业领域的关键技术 。

推荐阅读