Author 作者 编译|罗亿庭AlphaFold人工智慧蛋白质立体结构扩散模型机器学习复合物药物开发近年来,AlphaFold等人工智慧(artificial intelligence, AI)预测蛋白质立体结构的能力逐渐提升,为生物学研究带来革命性的突破。尽管如此,科学家仍期待AI能做到更多,像是预测蛋白质上的功能性修饰,或是与DNA、RNA等分子的互动。今(2024)年5月,DeepMind推出的Alphafold最新版本──AlphaFold 3,终於实现了此目标。
2021年AlphaFold 2的问世,让科学家能够从胺基酸序列直接预测蛋白质的立体结构,且准确度与实验室研究做出的结果相差无几。随後这项技术快速地被广泛应用於研究中,例如用於解析细胞中的重要蛋白质复合体、寻找新药物分子、绘制已知蛋白质的结构图谱等。不过,AlphaFold 2无法处理蛋白质上的功能性修饰,也无法预测蛋白质与其他分子,例如DNA、RNA等的互动。DeepMind最新推出的AlphaFold 3以Alphafold 2为基础,进行了重大的系统升级。AlphaFold 3使用一种被应用於Midjourney等图像生成式AI中的「扩散模型」(diffusionmodel)机器学习网络,使它对於目标序列相关的蛋白质资讯依赖性更低,且不仅能预测单个蛋白质的结构,还可以预测蛋白质与其他分子组成的复合物结构,并显示它们的结合方式。此外,AlphaFold 3也能做到前一代的Alphafold 2无法办到的事,那就是预测蛋白质与DNA、RNA等分子结合後的复合物结构。
来自英国弗朗西斯.克里克研究所(Francis Crick Institute)的生物化学家乌尔曼( Frank Uhlmann) 认为,AlphaFold 3是一项革命性突破,它让结构生物学研究变得更加简便容易。他的研究团队也已经利用AlphaFold 3预测了一些参与基因体复制的DNA结合蛋白质结构,并以实验证实AlphaFold 3预测的准确性。除了在基础研究领域的应用,AlphaFold 3在药物开发方面也展现出强大能力。它在预测小分子与蛋白质的结合方面,比传统的蛋白质分子对接(docking)〔注〕软体表现更为优异。
〔注〕透过物理的方式模拟化学物质与蛋白质的结合程度,後续会再藉助蛋白质实验以确定结构。
不过,AlphaFold 3与RoseTTAFold、AlphaFold 2不同,在使用上有一定的限制。现阶段,科学家无法获得完整的AlphaFold 3原始码,且此模型在训练後获得的其他资讯也不会被公开,只能通过DeepMind的线上服务进入AlphaFold 3伺服器进行结构预测,每天最多十次。另外,科学家也无法获得预测中可能与药物结合的蛋白质结构,且禁止商业用途。至於能够将AlphaFold 3的成果应用於药物开发的,则是DeepMind衍生的新公司「Isomorphic Labs」。
DeepMind的这项做法引发了一些争议。加州大学(University of California)药物化学家萧伊谢(BrianShoichet)就认为,由於药物分子与蛋白质结合的模拟受到限制,AlphaFold 3可能不会像AlphaFold 2那样对研究领域产生巨大影响。而麻省理工学院(Massachusetts Institute of Technology,MIT)的演化生物学家奥钦尼科夫(Sergey …