人类将会永生?谷歌 DeepMind重磅发布Alphafold 3 ——天花板级别的AI系统

当地时间 5 月 8 日顶级科学期刊《Nature》发表了一份重磅研究论文。谷歌 DeepMind 发布了其生物学预测工具 AlphaFold 的最新版本——AlphaFold 3

这个革命性的新模型,能以前所未有的精度预测所有生命分子的结构和相互作用。作为一个以整体方式计算整个分子复合物的单一模型,不仅可以预测蛋白质的结构,还可以预测几乎所有生命分子的结构,包括蛋白质、DNA、RNA、配体等对于蛋白质与其他分子类型的相互作用,从而能对药物发现带来至关重要的作用。

这份由谷歌DeepMind和其英国子公司Isomorphic Labs联合团队带来的46页成果显示,全新AI蛋白质结构预测模型AlphaFold 3,可准确预测生物分子相互作用的结构,而且相较于现有的预测技术,AlphaFold 3在蛋白质与其他分子类型的相互作用预测上至少提高50%,并在某些关键的相互作用类别上实现精度翻倍

2020年,谷歌旗下公司DeepMind首次推出基于AI的蛋白质结构预测工具——AlphaFold

2021年7月,DeepMind团队推出了AlphaFold 2,其能够根据氨基酸序列来准确预测蛋白质的3D结构——全球已有数百万研究人员将AlphaFold 2应用在疟疾疫苗和酶设计等领域。

此后,DeepMind团队还推出了AlphaFold-Multimer,用于预测蛋白质-蛋白质复合物的结构和相互作用。由于不同类型的特异性相互作用差异太大,扩大单一深度学习模型能预测的复合物范围一直很难。

AlphaFold 3的全新架构

AlphaFold 3的强大功能源自其全新的架构和训练方法覆盖所有生命分子。该模型核心部分是进化形成器(Evoformer)的升级版——一个深度学习架构,支持AlphaFold 2异乎寻常的表现。

AlphaFold 3基于Transformer构建,允许科学家输入生物分子复合物的描述,能预测该生物分子复合物的3D结构,并使用扩散过程生成每个原子的单独3D坐标,输入到指定系统。输入后,AlphaFold 3使用扩散网络处理其预测,类似于AI 图像生成器中的网络。扩散过程从原子云开始,经过许多步骤汇聚成最终的、最准确的分子结构。为避免扩散方法在一些无结构区域产生幻觉,还引入了一种新的交叉蒸馏方法,通过AlphaFold-Multimer v2预测的结构数据来丰富训练数据。AlphaFold 3在训练数据极度匮乏的领域也展现出了惊人的泛化能力。在几乎没有RNA训练数据的情况下CASP15的RNA预测任务中,在10个公开靶点上的平均表现超过了专门的RNA结构预测模型。

对于蛋白质与DNA结合的准确性,AlphaFold 3的成功率65%,目前的技术水平只有28%。甚至AlphaFold 3还改进了蛋白质相互作用能力,当蛋白质与抗体复杂结合时,AlphaFold 3的准确成功率达62%,而其他系统只有30%,AlphaFold 2性能的两倍。对于蛋白质与其他分子的重要相互作用领域,AlphaFold 3预测准确度提高一倍(100%)。

AlphaFold 3在预测分子相互作用方面的准确度超过了所有现有技术。作为一个能够全面计算整个分子复合体的单一模型。

下图展示了AlphaFold 3对蛋白质(蓝色)与DNA双螺旋(粉色)结合的分子复合物的预测,与真实分子结构(灰色)几乎完美匹配。

AlphaFold 3核心技术

AlphaFold 3 的核心技术基于其前身 AlphaFold 2 的 Evoformer 模块,在此基础上引入扩散网络(Diffusion Model),类似于人工智能图像生成器中使用的网络。通过从原子云开始,经过多个步骤汇聚成最终的、最准确的分子结构,AlphaFold 3 实现对蛋白质、核酸、小分子、离子和修饰残基等所有生命分子的联合结构预测。

AlphaFold 3 在预测生物分子结构和相互作用方面展现出前所未有的准确性:

• 与现有的预测方法相比,AlphaFold 3 至少有 50% 的改进。在预测一些重要的分子相互作用类别时,AlphaFold 3 的预测精度提高一倍。

• 在 PoseBusters 基准测试中,AlphaFold 3 的准确率比最好的传方法高出 50%,且无需输入任何结构信息作为先验。AlphaFold 3 成为第一个超越基于物理的生物分子结构预测工具的人工智能系统。

• 在预测药物相互作用方面,AlphaFold 3 实现前所未有的准确性,包括蛋白质与配体的结合以及抗体与其目标蛋白质的结合。

• AlphaFold 3 能够准确预测感冒病毒刺突蛋白与抗体和糖分子的复合物结构,与真实结构高度匹配。

AlphaFold 3意义何在?

AlphaFold 3通过对药物分子(例如与蛋白质结合的配体和抗体)的预测,为药物设计赋能,从而改变人类健康和疾病过程中蛋白质的相互作用方式。Isomorphic Labs正在使用AlphaFold 3以及一系列自主研发的AI模型,与制药公司合作进行药物研发。AlphaFold 3能够在几秒钟内生成高度精确的结构预测,为药物研发人员提供了快速准确预测从未被表征的复杂结构的能力。

Isomorphic Labs在日常工作中使用AlphaFold 3并发现:

· 针对AlphaFold 3的结构预测设计小分子,有助于设计出能有效结合靶蛋白的分子。

· AlphaFold 3提高了蛋白-蛋白相互作用结构的准确性,为设计新的治疗模式(如抗体或其他治疗性蛋白质)打开了可能性。

· 通过观察目标蛋白在完整生物环境中(与其他蛋白质、DNA、RNA或配体的结合)的结构,可以更深入地了解新靶点,有助于开发更有效的临床药物。

AlphaFold Server:免费且易于使用的研究工具

谷歌DeepMind一并推出AlphaFold Server免费平台用于预测蛋白质如何在细胞内与其他分子相互作用,允许全球科学家进行非商业性研究使用,包含免费的2亿蛋白质结构数据库。

只需点几下鼠标,就可以利用AlphaFold 3预测蛋白质、DNA、RNA以及一系列配体、离子和化学修饰组成的结构模型,进而帮助人们提出新颖的假设以便在实验室进行测试,加快创新。从此科学家在实验中的研究假设,就可以由AlphaFold Server验证。

AlphaFold Server平台,意义重大。

实验性的蛋白质结构预测,原本需要花费读个博士学位的时间,以及数十万美元的费用。而按照当前实验结构生物学的发展速度,这本需要数亿researcher-year的工作。有了AlphaFold 3,从此生物世界可以高清晰度呈现。科学家能够全面观察细胞系统的复杂性,包括结构、相互作用和修饰,药物作用、激素生成和DNA修复如何影响生物功能,从此都将被揭示。

AlphaFold 3局限性

· 立体化学限制:模型输出的立体化学有时会违反手性规则,尽管输入是正确手性的参考结构。另外,模型偶尔会产生重叠的原子。

· 幻觉影响:从非生成性的AlphaFold 2模型转换到基于扩散的AlphaFold 3模型,引入了在无序区域中产生虚假结构秩序(幻觉)的挑战。虽然幻觉区域通常被标记为低置信度,但它们可能缺乏AlphaFold 2在无序区域中产生的典型丝带状外观。

· 预测准确性问题:对于某些目标,准确预测仍然具有挑战性。为获得最高精度,可能需要生成大量预测并对其进行排名,这增加了计算成本。特别是对于抗体-抗原复合物,预测质量随着模型种子的数量增加而显著提高。

· 结构构象限制:模型预测的结构构象可能不正确或不够全面,这取决于指定的配体和其他输入。例如,E3泛素连接酶在无配体时呈现开放构象,但模型预测的构象只有闭合状态。

· 缺乏动态信息:模型主要预测生物分子系统的静态结构,而不是在溶液中的动态行为。

· 特定目标预测限制:对于某些特定类型的生物分子复合物,模型的预测可能存在局限性。

瑕不掩瑜,AlphaFold 3仍然证明可以构建一个深度学习系统,对所有这些相互作用显示出强大的覆盖和泛化能力。未来,实验结构测定方法的进步,如冷冻电镜和断层扫描技术的显著改进,将提供大量新训练数据,进一步改善这类模型的泛化能力。标志着在这一领域的一个重大突破,其对生物分子结构及相互作用的全方位预测能力,预示着对人类健康和疾病治疗的深远影响。

总结

  1. AlphaFold,开创蛋白质结构预测的新时代
  2. AlphaFold 2,大幅提高了预测精度
  3. AlphaFold-Multimer,将预测范围扩展到具有多个蛋白质链的复合物
  4. AlphaFold 2.3,提高了性能并将覆盖范围扩大到更大的复合物
  5. AlphaFold 3,继续将预测范围扩展到蛋白质、DNA、RNA以及一系列配体、离子和化学修饰等更多生物分子结构。

AlphaFold 3的问世不仅推动了对蛋白质的研究,还拓展到更广泛的生物分子领域,这一飞跃可能将开启更多变革性科学的新篇章,从开发生物可再生材料到加速药物设计和基因组学研究等领域都将受益匪浅

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/614286.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何在线网页浏览obj格式3D模型?

OBJ文件是一种3D模型格式,目前几乎大部分知名的3D软件都支持OBJ文件的读写,但是想要在网页在线查看obj文件,要怎样实现呢? 1、如何在线浏览obj格式模型? 其实只要通过51建模网,直接将obj格式的3D模型上传…

【数据结构】二叉树(Binary Tree)

文章目录 一、树的概念及结构二、二叉树的概念及结构1.二叉树的概念2.特殊的二叉树3.二叉树的性质 三、二叉树的存储顺序存储链式存储 四、二叉树的实现1.创建二叉树2.二叉树的遍历前序遍历中序遍历后序遍历层序遍历根据遍历顺序创建二叉树 3.二叉树的基本操作1.总结点个数2.二…

Vulnhub项目:ICA: 1

1、靶机介绍 靶机地址:ICA: 1 ~ VulnHub 2、渗透过程 首先,部署好靶机后,进行探测,发现靶机ip和本机ip,靶机ip156,本机ip146。 然后查看靶机ip有哪些端口,nmap一下。 出现22、80、3306端口&a…

使用Selenium破解滑动验证码的原理及解决思路

1、获取页面元素信息: 使用Selenium打开目标网页,并通过相关方法获取滑块、背景图等元素的位置和属性信息。可以使用Selenium提供的定位方法(如xpath、CSS选择器等)来找到这些元素。 可以使用find_element_by_xpath或find_elemen…

按键的短按、长按和连续的划分

在实际生活中,我们使用到的按键在短按、长按和按键松开时都会触发不同的功能。按键短按后松开和长按后松开的应用比短按和长按的应用较少,我了解的按键短按后松开和长按后松开的应用是在点动控制和长动控制中。这里主要讨论按键的短按、长按和连续这三种…

基于ConvNeXt网络的图像识别

1、前言 ConvNeXt 网络基于传统的卷积神经网络,与当下 transformer当道而言简直是一股清流 ConvNeXt并没有特别复杂或者创新的结构 ConvNeXt 网络有五种大小,可以参考下面 2、项目实现 完整的项目如下: 这里参考了网上的ConvNeXt 模型&…

计算机服务器中了devicdata勒索病毒如何解密,devicdata勒索病毒解密恢复工具

在网络技术飞速发展的时代,有效地利用网络开展各项工作业务,能够大大提升企业的生产运行效率,改善企业的发展运营模式,但如果网络利用不好就会给企业的数据安全带来严重威胁。近日,云天数据恢复中心接到很多企业的求助…

机柜风扇KTS011温湿度控制器KTO011风机控制温控器机械开关温控仪

品牌:威驰 型号:KTS011常开 产地:中国大陆 颜色分类:KTS011常开,KTO011常闭 KTS011与KTO011的区别 KTS011,常开型,可搭配风扇/风机使用:当环境温度超过温控器设定温度,温控…

如何挑选家用洗地机?需要注意什么?这四款洗地机性价比超高

洗地机结合了扫、拖、吸的功能,一台机器,一个推拉的动作便可以清理干净地面上的干湿垃圾,大大的节省了我们做家务的清洁时间,提升了生活质量。但是面对市面上众多的洗地机型号,我们要怎么去挑选呢,需要主要…

Goland GC

Goland GC 引用Go 1.3 mark and sweep 标记法Go 1.5 三色标记法屏障机制插入屏障删除写屏障总结 Go 1.8 混合写屏障(hybrid write barrier)机制总结 引用 https://zhuanlan.zhihu.com/p/675127867 Garbage Collection,缩写为GC,一种内存管理回收的机制…

JDK1.8 安装并配置环境变量

一、Windows 配置 1 安装文件 jdk-8u401-windows-i586.exe 2 环境变量 JAVA_HOME C:\Program Files (x86)\Java\jdk-1.8 CLASSPATH .;%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\lib\dt.jar; Path %JAVA_HOME%\bin 说明:Win7/Win8 中 Path 可能需要写成 ;%JAVA_HO…

新能源汽车动力电池浸没式冷却方案介绍与未来趋势

前言 新能源汽车的兴起标志着汽车工业的一次革命,其中动力电池的设计与性能成为了关键。浸没式冷却方案作为一种新兴的技术,为动力电池系统提供了有效的散热解决方案,其在未来的发展趋势备受关注。 一 动力电池浸没式冷却方案介绍 首先&am…

618洗地机推荐,市面上各式各样的洗地机怎么选?这里有答案

洗地机的出现极大地改变了清洁方式,通过结合扫地、拖地、吸尘等多种功能,实现了一机多用的便捷清洁体验。而且洗地机不需要弯腰,每次也不用清洁很长时间,节省出来的时间可以更好的休息,但是市面上各式各样的洗地机怎么…

Amesim基础篇-热仿真常用模型库-Thermal Hydraulic /Resistance

有言在先 流体库、管路库在热管理中是必备模块,如动力电池液冷循环系统均需要Thermal Hydraulic /Resistance库的元件建模。 1 流体物性设置 AMEsim中内嵌了大部分液冷的热物性,直接在流体子模型上选择即可。常规使用的是50%乙二醇水溶液,如…

【小白可懂】SpringBootWeb入门

web开发需要的技术栈: 前端web开发: html css javascript Vue Element Nginx 后端web开发: Maven SpringBoot Web 基础篇 MySOL SpringBoot Mybatis SpringBoot Web开发篇 SpringBoot web进阶篇 什么是spring? 官网&a…

网络爬虫概述与原理

网络爬虫概述与原理 网络爬虫简介狭义上理解功能上理解常见用途总结 网络爬虫分类通用网络爬虫聚焦网络爬虫增量网络爬虫深度网络爬虫 网络爬虫流程网络爬虫采集策略深度有限搜索策略广度优先搜索策略 网络爬虫简介 通过有效地获取网络资源的方式,便是网络爬虫。网…

基于 LlaMA 3 + LangGraph 在windows本地部署大模型 (二)

基于 LlaMA 3 LangGraph 在windows本地部署大模型 (二) #Options local_llm llama3 llm ChatOllama(modellocal_llm, format"json", temperature0) #embeddings #embeddings OllamaEmbeddings(model"nomic-embed-text") embed…

蛋糕店做配送小程序的作用是什么

蛋糕烘焙除了生日需要,对喜吃之人来说往往复购率较高,除线下实体店经营外,更多的商家选择线上多种方式获客转化、持续提高生意营收,而除了进驻第三方平台外,构建品牌私域自营店铺也同样重要。 运用【雨科】平台搭建蛋…

Excel中实现md5加密

1.注意事项 (1)在Microsoft Excel上操作 (2)使用完,建议修改的配置全部还原,防止有风险。 2.准备MD5宏插件 MD5加密宏插件放置到F盘下(直接F盘下,不用放到具体某一个文件夹下) 提示:文件在文章顶部&…

营业执照OCR识别接口如何对接

营业执照OCR识别接口也叫营业执照文字识别OCR接口,指的是传入营业执照图片,精准识别静态营业执照图像上的文字信息。那么营业执照OCR识别接口如何对接呢? 首先我们找到一家有做营业执照OCR识别接口的服务商,数脉API,然后注册账户…