提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
科研人员揭示基因转录“刹车”机制******
中新网上海1月12日电 (记者 郑莹莹)记者从中国科学院分子植物科学卓越创新中心获悉,北京时间1月12日,中美科研团队合作在《自然》杂志上发表了一篇研究论文,该研究揭示了细菌RNA聚合酶如何识别“转录终止序列”从而终止转录的工作机制。
科研人员介绍,RNA聚合酶在执行基因转录时类似高速行驶的汽车,以大约每秒50个核苷酸的速度合成RNA,当RNA聚合酶转录至“终止序列”时,需要从高速延伸的状态“刹车”,停止转录并释放RNA。
细菌的“固有转录终止序列”是一段由大约30个至50个核苷酸碱基组成的序列。研究团队捕获了RNA聚合酶转录终止的一系列中间状态,解析了RNA聚合酶在上述转录终止中间状态的冷冻电镜三维结构。
研究发现,“转录终止序列”的多聚尿苷使RNA聚合酶“刹车”,将其固定在转录暂停状态,随后RNA发卡结构折叠进入RNA聚合酶内部,促使RNA从RNA聚合酶内部解离。
该研究回答了基因表达的基础科学问题,拓展了人们对于基因表达机制的理解。
这项研究具体由中国科学院分子植物科学卓越创新中心的张余研究团队和美国威斯康星大学麦迪逊分校(University of Wisconsin-Madison)的Robert Landick团队以及浙江大学的冯钰团队合作完成。中科院分子植物科学卓越创新中心的博士生尤琳琳(已毕业)为论文第一作者,该中心的张余研究员和威斯康星大学麦迪逊分校的Robert Landick教授以及浙江大学的冯钰研究员为共同通讯作者。(完)