新闻中心

实现5Å全原子RMSD,普渡大学深度学习方法准确预测RNA三级结构,登Nature子刊

2025-01-30
浏览次数:
返回列表

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

编辑 | 萝卜皮

非编码 RNA 在各种生物功能中发挥着调控作用,并且与人类健康、药物设计等领域息息相关。

了解功能的机械机制需要三级结构信息,然而,通过实验确定 RNA 三维结构成本高昂且耗时,导致 RNA 序列和结构数据之间存在巨大差距。

为了应对这一挑战,普渡大学(Purdue University West Lafayette)的研究人员开发了 NuFold 来准确预测 RNA 三级结构。

NuFold 是一个深度神经网络,针对输入序列的输出结构进行端到端训练;它采用了碱基中心表示法,可实现核糖环的灵活构象。

NuFold 在构建正确的 RNA 局部几何结构方面表现出特殊优势。此外,NuFold 还能够通过链接输入序列来预测 RNA 的多聚体复合结构。

该研究以「NuFold: end-to-end approach for RNA tertiary structure prediction with flexible nucleobase center representation」为题,于 2025 年 1 月 21 日发布在《Nature Communications》。

图片

核糖核酸 (RNA) 是生物体的基本分子。除了作为转录中使用的信使 RNA 发挥核心作用外,RNA 分子还以非编码 RNA (ncRNA) 的形式发挥各种生物学功能,它们参与基因调控和修饰等功能。

RNACentral 数据库目前包含超过三千万个 ncRNA 序列。ncRNA 在药物设计中也备受关注,因为新药可能被设计成抑制或模仿功能性 RNA 的活性。

在最新的研究中,普渡大学的研究团队开发了一种使用端到端深度网络架构的从头 RNA 结构预测方法 NuFold。该方法采用目标 RNA 序列,并通过经过全面训练的单个网络生成三级结构模型。

图片

图示:NuFold 概述。(来源:论文)

该网络架构基于 AlphaFold2(AF2),这是一种蛋白质结构预测方法,在 2025 年的 CASP14(结构预测关键评估)中取得了出色的表现。

在 AF2 架构的基础上,研究人员进行了重大修改。这些修改包括调整核酸序列,以二级结构作为输入,修改预测 RNA 特定碱基间角度、距离和原子位置的方法,以及允许 RNA 结构表示具有完全的灵活性。

该团队的实现方法称为核碱基中心表示,可以优化核碱基所有可旋转键的角度。这种表示使他们能够重现碱基骨架中存在的任何灵活性,为精确的碱基构象建模奠定了基础。

与基于深度学习的方法相比,NuFold 是一种独特的端到端模型,它直接从 MSA 输出完整的原子模型并预测二级结构,这与许多其他深度学习模型不同,这些模型需要预测原子间距离和角度约束以用于后续的结构建模过程。

Reachout.ai Reachout.ai

一个AI驱动的视频开发平台,专为忙碌的企业家和销售团队打造

Reachout.ai 142 查看详情 Reachout.ai

图片

图示:基准结果用于比较预测方法。(来源:论文)

目前来讲,RhoFold 是唯一一个具有与 NuFold 类似架构的其他端到端模型。

这两个架构的明显差异在于,RhoFold 使用语言模型来处理输入的 MSA,而 NuFold 以类似于 AF2 的更直接的方式获取 MSA,并且 NuFold 将预测的二级结构信息作为另一个输入。

RNA 结构预测可能比蛋白质预测更困难,因为 RNA 分子更灵活,而且与蛋白质相比,可用的结构数据非常有限。该团队研究了几种克服这一困难的方法:为了增加训练数据的数量,研究人员采用了一种自提炼技术,将被认为足够准确的预测结构纳入训练集。

图片

图示:目标长度、MSA 深度、回收和宏基因组 MSA 对建模准确性的影响。(来源:论文)

为了增加输入 MSA 的深度,科学家加入了宏基因组序列;事实证明,利用宏基因组序列作为输入 MSA 并优化循环次数可提高 NuFold 的预测性能。在训练过程中,他们采用了动态采样策略,在易目标和难目标之间保持平衡。

此外,团队还测试了几个较小的网络,因为他们拥有的训练数据比原始 AF2 中使用的蛋白质数据集要小。NuFold 对大多数测试目标实现了 5 Å 或更低的全原子 RMSD,几乎完美地构建了构象,柔性末端和环状区域除外。

未来

虽然 NuFold的表现明显优于基于能量最小化的方法,但表现略差于近期发布的一些基于深度学习的方法。

一个原因是,训练数据量不足以支持这种完全原子级详细模型。训练数据不足对于任何 RNA 结构预测方法来说都是一个挑战,但对于 NuFold 来说,这可能更为关键,因为它直接从深度神经网络建模完整的原子结构。

为了解决这个问题,结合不同的数据模式非常重要,例如提供 RNA 二级结构洞察的实验数据,如 DMS-MaPseq 和 SHAPE-MaP。

关于未来的工作,由于 RNA 的构象会受到与其他分子相互作用的影响,因此多链、RNA 和蛋白质的结合是 NuFold 的一个扩展。除了 RNA 和蛋白质之外,使用小化合物建模也是一个重要的扩展,因为 RNA 是药物发现的新兴目标。

源代码:https://github.com/kiharalab/nufold/

论文链接:https://www.nature.com/articles/s41467-025-56261-7

以上就是实现5Å全原子RMSD,普渡大学深度学习方法准确预测RNA三级结构,登Nature子刊的详细内容,更多请关注其它相关文章!


# git  # ai  # 质数  # red  # 2025  # Type  # 理论  # app校园推广营销方案ppt模板  # 渲染图ai优化网站  # 百度seo关键词排名 乐云践新专家  # 货源怎么找网站推广员  # 江西省网站建设找哪家  # 丹东建设网站选哪家  # 品牌seo系统  # seo实战技术  # 苏州营销推广是什么公司  # 高青公司网站建设谁会做  # 几个  # 是一个  # 都是  # 解锁  # 官网  # 这一  # 端到  # 采用了  # 宏基  # 普渡 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 微信最多可以加多少好友  三星 nfc什么功能是什么意思  wps中datediff函数怎么用 WPS中DATEDIFF函数的语法和用法分享  苹果16最近玩法有哪些  安装固态硬盘如何设置  如何ping测试命令  夸克po什么意思  如何winpe cmd命令  linux如何打开命令窗口  破太岁是什么意思  得物怎样不扣手续费 如何通过得物不支付手续费  如何用命令查看数据库日志文件  solidworks打开igs文件看不见要怎么办解决方法  折叠屏手机好不好,耐不耐用  typescript怎么用  如何判断固态硬盘  power在坐标轴中是什么意思  高市盈率是什么意思  闪光灯power闪烁是什么意思  固态硬盘内存如何查找  如何以命令符运行程序  固态硬盘如何消除缓存  金色cmyk色值是多少  如何使用命令行界面  win10系统如何打开cmd命令  如何激活固态硬盘  在遥控器中power是什么意思  win7旗舰版wifi怎么打开  电动车power灯亮红灯是什么意思  苹果16颜色有哪些  openwrt有哪些功能  typescript如何标记私有方法  苹果16将会带来哪些升级  如何修改cad命令  power在充电器上是什么意思  typescript怎么拼接  汽车中控导航机power线是什么意思  苹果16有哪些不同  树莓派命令行如何新建文件  征信不好如何短期恢复  如何拍屏幕不出条纹详细方法  sofa是什么意思  单片机.lib文件怎么打开  爱奇艺会员qq登录可以几个人用?  如何安装固态硬盘win10  怎么在项目中使用typescript  区块链的热闹将何去何从?  交管12123协议头不完整怎么解决  春运抢票准备什么东西  新的固态硬盘如何分区 

搜索