位点|潜在位点难预测人工智能来帮忙( 二 )


在此背景下 , 以深度学习为核心的人工智能技术在处理大数据(包括图像数据、多组学数据)方面具有显著优势 。
“考虑到人工智能在处理大数据方面的优势 , 以及表观遗传动态可逆的特点 , 应用人工智能的技术预测修饰位点可以弥补由于检测技术、实验成本、取材组织造成的表观修饰位点鉴定数量不足的问题 。利用深度学习算法和模型优势 , 我们可以训练AI分析表观遗传多组学大数据 , 从而获得有重要应用价值的潜在表观修饰位点 。”谷晓峰说 。
谷晓峰介绍 , 通过深度学习和训练 , 该团队基于卷积神经网络(CNN)方法 , 利用课题组前期绘制的粳稻日本晴的多种表观修饰图谱 , 构建得到了具有高准确度的智能预测模型(SMEP) 。
“人工智能首先通过收集与整理已发表的重要表观遗传组学数据和修饰位点 , 然后利用深度学习的算法从中进行特征序列提取、特征序列学习训练、构建智能预测模型 , 然后再对基因组序列进行扫描 , 发现潜在的表观修饰位点 。”田健解释道 。
普莉介绍 , 为了验证该模型的预测是否成功 , 他们采用多个准确率评估指标来评估预测准确率;利用两个不同水稻品种(籼稻和粳稻)的表观数据进行相互验证;将预测结果与已发表的传统机器学习方法进行比较 , 进一步验证该方法的准确率;利用表观遗传检测手段 , 验证预测位点的表观修饰水平变化 。
经过参数优化、交叉验证以及实验验证 , SMEP模型在预测DNA甲基化、RNA甲基化和组蛋白修饰等表观遗传修饰位点中具有高可信度 。
免费在线智能预测
“这个模型从数据库中预测到了水稻、玉米等作物中大量潜在的表观修饰位点 , 这些修饰位点是常规技术尚未检测到的 , 参与了调控基因表达、环境胁迫响应等重要过程 。”谷晓峰说 。
水稻、玉米等是重要的粮食作物 , 其产量和品质受到全球变暖和极端高温的严重威胁而显著降低 。研究显示 , 平均气温每上升1摄氏度 , 水稻产量就可能下降10% , 玉米产量下降5.8%以上 。
谷晓峰说 , 应对挑战的关键是系统阐明作物响应高温胁迫的生物学基础 , 鉴定和优化响应高温胁迫的关键基因和调控位点 , 培育抵抗高温胁迫的新品种 。
他们研究发现 , 水稻中DNA腺嘌呤甲基化能够影响基因表达 , 从而响应高温胁迫的环境信号 。在热胁迫响应中 , 主要通过动态调节DNA腺嘌呤甲基化水平和影响热胁迫响应基因的表达两种方式发挥作用 。
为了验证预测位点的准确性 , 他们利用水稻幼苗期经高温胁迫(45℃)处理36小时的材料 , 进行DNA腺嘌呤甲基化特异抗体实验 。他们选取三个热响应转录调节基因作为候选基因 , 根据预测的潜在的表观修饰位点所在区域设计引物 。
“结果表明 , 预测位点和实验结果吻合度很高 , 显示了智能预测位点的准确性和实用性 。”普莉说 , 预测的表观遗传修饰位点可以为水稻、玉米的耐高温育种提供有用的基因资源和位点 , 加速培育耐高温的作物新品种 。
基因组数据非常庞大 , 其中还有更多表观遗传修饰位点待发现 。为了让更多科学家关注和参与相关研究 , 该团队构建了SMEP在线智能预测工具 , 可向用户免费提供检索表观遗传修饰位点和基因表达数据的可视化界面 。

推荐阅读