提速近10倍!基于深度学习的全基因组选择新方法来了******
近日,中国农业科学院作物科学研究所、三亚南繁研究院大数据智能设计育种创新团队联合多家单位提出利用植物海量多组学数据进行全基因组预测的深度学习方法, 可以实现育种大数据的高效整合与利用,将助力深度学习在全基因组选择中的应用,为智能设计育种及平台构建提供有效工具。相关研究成果发表在《分子植物(Molecular Plant)》上。
全基因组选择作为新一代育种技术,通过构建预测模型,根据基因组估计育种值进行早期个体的预测和选择,从而缩短育种世代间隔,加快育种进程,节约成本,推动现代育种向精准化和高效化方向发展。
统计模型作为全基因组选择的核心,极大地影响了全基因组预测的准确度和效率。传统预测方法基于线性回归模型,难以捕捉基因型和表型间的复杂关系。
相较于传统模型,非线性模型(如深度网络神经)具备分析复杂非加性效应的能力,人工智能和深度学习算法为解决大数据分析和高性能并行运算等难题提供了新的契机,深度学习算法的优化将会提高全基因组选择的预测能力。
该研究团队以玉米、小麦和番茄3种作物的4种不同维度的群体数据为测试材料,通过创新深度学习算法框架开发了全基因组选择新方法。
与其他五种主流预测方法相比,该方法有以下优点: 可以利用多组学数据开展全基因组预测;算法设计中包含批归一化层、回调函数和校正线性激活函数等结构,可以有效降低模型错误率,提高运行速度;预测精度稳健,在小型数据集上的表现与目前主流预测模型相当,在大规模数据集上预测优势更加明显;计算时间与传统方法相近,比已有深度学习方法提速近10倍;超参数调整对用户更加友好。
该研究得到了国家重点研发计划、国家自然科学基金、海南崖州湾种子实验室和中国农业科学院科技创新工程等项目的支持。
学术支持
中国农业科学院作物科学研究所
记者
宋雅娟
斯诺克德国大师赛:3名中国选手跻身16强 肖国栋挺进8强******
中新社北京2月3日电 北京时间3日晨,2023年斯诺克德国大师赛结束正赛第二日的较量,3名中国选手晋级16强,其中肖国栋率先挺进8强。
本次德国大师赛正赛第二日一天双赛。在率先进行的1/16决赛中,3名中国选手曹宇鹏、斯佳辉和庞俊旭相继登场。遗憾的是,曹宇鹏和斯佳辉双双落败,且过程如出一辙——曾两获排名赛亚军的“90后”名将曹宇鹏在前3局3:0领先的大好局面下,以4:5遭英格兰球员希斯科特逆转绝杀;20岁小将斯佳辉在3:1领先之际,同样以4:5被刚获单局限时赛冠军的克里斯·韦克林翻盘绝杀。
在另一场1/16决赛中,中国“00后”小将庞俊旭以5:3战胜苏格兰选手罗斯·缪尔,成为当日唯一一位杀入16强的中国选手。在首日赛事中,两名“80后”老将肖国栋和田鹏飞已率先晋级,因此,共有3名中国选手跻身本次德国大师赛16强。
当日还进行了上半区的4场1/8决赛,肖国栋和田鹏飞双双上阵,1胜1负。
面对英格兰球员斯莱瑟,肖国栋状态火热,连赢4局进入赛点。虽然斯莱瑟赢下第五局,但也只是避免了被横扫的尴尬,最终肖国栋以5:1轻松晋级8强,将在1/4决赛中迎战世界排名第12位的利索夫斯基,后者在1/8决赛中淘汰了已年过六旬的传奇老将吉米·怀特。
田鹏飞1/8决赛的对手是同为“80后”的英格兰球员汤姆·福德。势均力敌的双方前4局打成2:2平,但最终进入去年英锦赛四强的汤姆·福德以5:3获得了最后的胜利,他将在1/4决赛中迎战“最强90后”凯伦·威尔逊。
共有8名中国选手参加本次德国大师赛正赛。两日战罢,中国军团“幸存者”仅剩2人,他们将在第三日的赛事中继续出战——庞俊旭将率先争夺8强名额,肖国栋则将全力冲击4强席位。(完)
(文图:赵筱尘 巫邓炎)