文心生物计算大模型重磅升级,构象预测准确度全面提升!

文心生物计算大模型家族又迎来了重磅的升级:蛋白质-小分子对接构象预测模型HelixDock,以及蛋白-蛋白复合物结构预测模型HelixFold-Multimer准确度全面提升。这两项新技术可以大幅提升蛋白质-小分子的对接构象及蛋白-蛋白复合物结构预测的精度,为基于结构的药物设计奠定了扎实的基础。

蛋白质-小分子对接构象预测模型HelixDock

蛋白质-小分子对接构象预测是小分子药物发现的核心环节。传统的分子对接工具(如LeDock,AutoDock Vina,Glide等)受限于有限的构象采样次数及粗糙的打分函数,精度不足。当前也有一些基于深度学习的技术(如Equibind,TankBind,DiffDock和Uni-Mol),其表现相比起传统工具有提升,但这些模型在泛化能力与预测的结构合法性上仍存在较大的问题。

百度飞桨螺旋桨团队通过构建大规模的模拟数据集、升级基于几何的神经网络等手段,构建蛋白质-小分子对接构象预测模型HelixDock,大幅度提升了构象预测的准确度。在PDBBind core set上对比其他方法RMSD≤2Å的比例高达89%(图一)。在数据分布不一样且更加难的数据集上(RCSB PDB中收集的最近的数据集Recent-PDB和PoseBusters基准集),HelixDock的预测结果大幅度领先其他方法(图二),也包括DeepMind最新公布的AlphaFold-lastest(图三)。

图片

图一 PDBBind core set的对比效果

图片

图二 Recent PDB上的对比效果

图片

图三 在PoseBusters基准集上达到业界最佳

对比AlphaFold-latest技术文档中展示的的示例,HelixDock的预测结果也极具竞争力,在2个示例中预测结果明显优于AlphaFold-latest(图四)。这充分体现出HelixDock的强泛化能力。

图片

图四 HelixDock vs AlphaFold-latest 在3个示例上的对比效果图

更多结果详见HelixDock文章:

https://arxiv.org/abs/2310.13913

蛋白-蛋白复合物结构预测模型HelixFold-Multimer

在大分子药物发现中,蛋白质复合体的结构预测发挥着至关重要的作用。无论是基于能量函数打分的对接工具(如ZDock和HDock),还是基于深度神经网络的对接方法(如Equidock和AlphaFold),精度上都有很大的提升空间。特别地,在与大分子药物发现更相关的抗原-抗体和多肽-蛋白复合物的场景上,现有方法的准确度都难以达到应用状态(一般认为DockQ大于0.23即可用)。

鉴于此,百度飞桨螺旋桨团队研发了蛋白-蛋白复合物结构预测模型HelixFold-Multimer,在抗原-抗体、多肽-蛋白等场景上取得了突破进展,相比其他方法DockQ大幅提升。HelixFold-Multimer 在68例2022年10月后公开的Sabdab抗原-抗体测试数据上,单模型的DockQ达到0.49,多模型融合的DockQ达到0.5,成功率达到67.6%,远超其他已公开方法(图五)。

图片

图五 HelixFold-Multimer在抗原-抗体复合物结构预测的结果

在多肽-蛋白复合物结构预测场景,选取PDB数据库在2021年10月后发布的 61个多肽-蛋白复合体结构数据进行评估。单模型DockQ达到0.380,多模型融合的DockQ达到0.387,领先于其他结构预测方法(图六)。

图片

图六 HelixFold-Multimer 在多肽-蛋白复合物结构预测的结果

示例:

示例1: 7VD7 沙门氏菌的毒素-抗毒素复合物,复合体构象预测可以帮助理解毒素和抗毒素如何相互作用以调节细胞内过程。Alphafold 2.3在红色圈部分预测差异大,而 HelixFold-Multimer 预测得到了准确的构象(图七)。

图片

图七:7VD7复合体预测结果

示例2: 7UA2 疟疾传播阻断抗原Pfs230 domain 1 (Pfs230D1) 与纳米抗体的复合体构象,其中Pfs230D1是一种高功能活性的疟疾传播阻断疫苗抗原,已在临床试验中得到广泛验证。7UA2复合体包含了Pfs230D1疫苗接种的受试者产生的人源单克隆抗体(hmAbs)和Pfs230D1构象。可以看到 HelixFold-Multimer 预测的构象(蓝色)几乎与真值重合,对接面的预测 DockQ也达到0.819,Interface RMSD为0.826 Ȧ(图八)。

图片

图八 7UA2复合体预测结果

很高兴和大家分享文心生物计算大模型现阶段已经取得的进展,同时我们也关注到了DeepMind最近公开的AlphaFold-latest的相关成果,但由于DeepMind并未开源,也未放出线上服务,因此我们只能在公开可比的数据集上进行了比较(详见正文)。我们将于近期面向公众开放 HelixDock和HelixFold-Multimer等相关工作的试用,敬请期待。同时我们也深知,AI技术的更迭日新月异,想要全面领先,就需要集结大家的力量。我们希望探索出一种新形式,将强大的底座模型能力开放给国内的科研工作者们,以在更加广泛的维度上推动生物计算领域的技术变革。也希望对此工作感兴趣的专家学者与我们联系,共同推进生物计算大模型在应用侧的研究。

  • 飞桨螺旋桨访问地址:

    https://paddlehelix.baidu.com/

  • 联系我们:

    baidubio_cooperate@baidu.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/148023.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2023年亚太杯APMCM数学建模大赛数据分析题MySQL的使用

2023年亚太杯APMCM数学建模大赛 以2022年C题全球变暖数据为例 数据分析: 以2022年亚太杯数学建模C题为例,首先在navicat建数据库然后右键“表”,单击“导入向导”,选择对应的数据格式及字符集进行数据导入 导入之后&#xff0c…

外贸客户管理系统是什么?推荐的管理软件?

外贸客户管理系统哪个好用?海洋建站如何选管理系统? 外贸客户管理系统,是一款专为外贸企业设计的客户关系管理系统,旨在帮助外贸企业建立与维护客户关系,提高客户满意度和忠诚度,提升企业业绩。海洋建站将…

005.终端信息、日期、调试

编写命令行shell脚本时,总是免不了处理当前终端的相关信息,比如行数、列数、光标位置、遮盖的密码字段等。tput和stty是两款终端处理工具。 1、获取终端信息 a. tput 命令 获取终端行数 tput cols 获取终端列数 tput lines 打印当前的终端名 tput…

java创造对象

java创造对象主要分为以下几个步骤 获取对应的类,查看是否加载,如果没有加载把类进行加载根据类的信息可以直接获取到实例的大小,分配对应内存调用实例的方法 比如说 class bb implements Serializable {private String bb; }class aa ext…

【C#学习】给FormClosing增加消息响应函数

第一步:增加消息句柄 第二步:编写消息函数 private void Form1_FormClosing(object sender, FormClosingEventArgs e) {//add your code hereserialPort1.Close();}

【23真题】懒得出题!连续两年试卷相同!

连续两年出题一样,老师都懒得出题的院校又被我抓到一所!(上次是天津工业22和21年一模一样),这次沈阳工业的老师多多少少改了几个数,但是也大差不差,考这所院校,猛刷真题,…

亚马逊鲲鹏系统可全自动化批量操作亚马逊买家号

亚马逊鲲鹏系统可以注册买家号、智能养号、自动下单、自动留评、QA等,是一款从注册到下单于一体的软件。 如果想要自动化注册,那么准备好账号所需要的邮箱、ip、手机号之后就可以进行自动注册了,注册时可以自动输入账号密码信息、自动接收验证…

11.3SpringMVC

一.概念 1.SpringMvc: a.构建在Servlet(api)基础上. b.是一个Web框架(HTTP). c.来自于Spring webMVC模块. 2.MVC 二.注册路由的注解 1.RequestMapping("/test") // 路由注册 注意: 这个注解在类和方法上都要使用,代表不同等级的路由. 2.RestController a)R…

ALPC_Natural_Selection

刚刚结束的ICPC2023沈阳是自然选择号的最后一场 XCPC 区域赛,很高兴也很幸运能拿到校排名 rk4,圆了一个这半年才开始做的梦。在这里讲一下这支队伍的故事。 组队、训练 本来和wjy666(aka maple)打完 EC Final 之后是想要退役的&…

“程序员们的奔溃瞬间”——分享你最令你哭笑不得的程序员经历

文章目录 每日一句正能量前言编程趣事后记 每日一句正能量 每件事最后都会是好事。如果不是好事,说明还没到最后。 前言 作为程序员,我们时常会遇到各种奇怪的错误和挑战,有时候我们会崩溃,但更多的时候,我们会从中学…

从0开始学习JavaScript--JavaScript基础

JavaScript作为一门前端编程语言,在现代web开发中扮演着不可替代的角色。它不仅为网页增添了动态和交互性,而且随着Node.js的崛起,也在服务器端开发中占据了重要地位。在本章节中,我们将探讨JavaScript的作用、重要性以及与其他前…

第二证券:大爆发!道指一夜大涨近500点

当地时间11月14日,美股三大股指显着上涨,其间,道指涨1.43%,标普500指数涨1.91%,纳斯达克指数涨2.37%。 标普500指数创4月份以来的最大单日涨幅。美债收益率大跌。美国10月CPI数据进步了美联储结束加息行为的希望&…

Find My平衡车|苹果Find My技术与平衡车结合,智能防丢,全球定位

随着人们环保意识的加强,电动车的数量与日俱增。与此同时,科学家经过潜心的研究,终于开发出新款两轮电动平衡车。两轮电动平衡车是一种新型的交通工具,它与电动自行车和摩托车车轮前后排列方式不同,而是采用两轮并排固…

舞台演出控制软件:QLab Pro

QLab Pro是一款功能强大的现场多媒体控制器软件,专为Mac用户设计。它提供了一个直观简洁的用户界面,使得用户能轻松管理和组织所有的媒体资源。QLab Pro支持导入各种音频和视频文件,并具备强大的音频、视频处理和灯光控制功能,可以…

Umi-OCR :一个完全离线的OCR图片转文字识别软件。

Umi-OCR :一个完全离线的OCR图片转文字识别软件。 开源免费,支持截屏或批量导入图片,并能识别多国语言,合并段落,处理竖排文字。 排除图片中的水印区域,提取干净的文本。 忽略特定区域的文字识别&#x…

什么是Vue.js中的单向数据流(one-way data flow)?为什么它重要?

聚沙成塔每天进步一点点 ⭐ 专栏简介 前端入门之旅:探索Web开发的奇妙世界 欢迎来到前端入门之旅!感兴趣的可以订阅本专栏哦!这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发…

colormap与colorbar应用

一,colormap 常见色度枚举值如下 应用如下 img cv2.applyColorMap(img, cv2.COLORMAP_JET) cv2.imshow(img,img) cv2.waitKey(0) cv2.destroyAllWindows() 常用的COLORMAP_JET效果如下,该模式常用于生成热力图 二,colorbar colorbar所有…

洗袜子的洗衣机哪款好?家用小洗衣机推荐

最近这两年在洗衣机中火出圈的内衣洗衣机,它不仅可以清洁我们较难清洗的衣物,自带除菌功能,可以让衣物上的细菌,还能在清洗的过程中呵护我们衣物的面料,虽然说它是内衣洗衣机,它的功能不止可以清洗内衣&…

VS2017新建.hpp文件

目录 1、新建h文件的方法:2、新建对用的cpp文件:3、在main.cpp中调用 1、新建h文件的方法: 2、新建对用的cpp文件: 3、在main.cpp中调用 参见大佬博客

[Linux]tcpdump抓包工具

windows中的抓包工具:wireshark linux中的抓包工具:tcpdump cpdump是Linux系统中自带抓包工具 [rootIKUN ~]# rpm -q tcpdump tcpdump-4.9.0-5.el7.x86_64 [rootIKUN ~]# tcpdump tcp -i ens33 -t -s 0 -c 100 and dst port ! 22 and src net 192.1…