一款基于人工智能的系统成功地规划并实施了真实世界的化学实验,显示出帮助人类科学家更快、更多地发现新知识的潜力
在你阅读本文的时间里,一个由人工智能驱动的系统已经能够自学并设计出用于某些诺贝尔奖级化学反应的实验室程序。AI 在短短几分钟内完成了这一切,并且首次尝试就取得了成功。
卡内基梅隆大学的化学家和化学工程师 Gabe Gomes 表示:“这是首次由非有机智能规划、设计并执行这种复杂的由人类发明的化学反应。”Gomes 领导的研究团队组建并测试了这一基于 AI 的系统,并将其命名为“Coscientist”。
Coscientist 完成的最为复杂的反应是有机化学中的钯催化交叉偶联。这项反应让其人类发明者荣获了 2010 年化学诺贝尔奖,因为它在制药开发和其他依赖于复杂碳基分子的行业中扮演了重要角色。
在 Nature 杂志 发表的 Coscientist 展示能力,揭示了人类通过使用 AI 加速科学发现的速度和数量的巨大潜力,并提高了实验结果的可重复性和可靠性。该四人研究团队包括博士生 Daniil Boiko 和 Robert MacKnight,他们分别在美国国家科学基金会的化学酶合成中心和圣母大学的计算机辅助合成中心接受支持和培训。
美国国家科学基金会化学部门主任 David Berkowitz 评论说:“Gomes 和他的团队不仅展示了他们系统在化学合成方面的能力,还成功地创造了一种高效的实验室合作伙伴。”他补充道:“他们将各部分巧妙组合,创造出的成果远超各部分之和,这对科学研究具有真正的实用价值。”
构建“Coscientist”
“Coscientist”项目的核心是由软件和硅制部件组成的,其中最重要的是构成其人工“大脑”的大语言模型(Large Language Model)。这类 AI 能够从大量数据中挖掘意义和模式,特别是处理文档中的书面文字。团队通过多项任务,测试并对比了多个大语言模型,包括 GPT-4 和 OpenAI 公司开发的其他 GPT 系列模型。
此外,“Coscientist”还整合了几种不同的软件组件。团队最初对每个组件进行单独测试,随后进行综合应用测试。
Boiko,负责设计“Coscientist”的总体架构和实验任务,分享了他的思路:“我们尝试把科学研究中的所有任务细分,然后逐步拼凑出完整的科研画面。最终,我们实现了各部分的有机结合。”
“Coscientist”的软件组件让它能够执行所有研究化学家日常的工作:搜集关于化学化合物的公开信息、查阅控制实验室机器人设备的技术手册、编写实验用的计算机代码,以及分析实验数据,判定哪些方法有效,哪些无效。
其中一个测试是检验“Coscientist”规划化学实验流程的准确性,这些流程若被实际执行,能够合成常见药物,如阿司匹林、对乙酰氨基酚和布洛芬。团队对不同的大语言模型进行了单独测试和比较,包括两个版本的 GPT,以及一个使其能像人类化学家一样使用 Google 搜索互联网信息的软件组件。然后,根据合成目标物质的可能性、流程的详细程度及其他因素,对这些流程进行了评估和打分。在这些测试中,启用搜索功能的 GPT-4 模块表现突出,它是唯一一个设计出了合成布洛芬的高质量流程的模块。
Boiko 和 MacKnight 观察到 Coscientist 展示了一种被称为“化学推理”的能力。Boiko 解释说,这种能力指的是利用与化学相关的信息和之前获取的知识来指导行动。Coscientist 使用的是公开的化学信息,这些信息采用了一种名为简化分子输入行条目系统(SMILES)的格式,这是一种能够用机器阅读的方式表达分子结构的符号系统。基于它在 SMILES 数据中分析的分子的特定部分,Coscientist 调整了自己的实验计划。Boiko 评价道:“这是目前实现的化学推理中最先进的版本。”
此外,进一步的测试让 Coscientist 能够搜索和利用描述机器人实验室设备控制系统的技术文档。这些测试对于验证 Coscientist 是否能把合成化学物质的理论计划转换成指导实验室机器人在现实世界中操作的计算机代码非常关键。
机器人的崛起
实验室里常用的高科技机器人化学设备能够以极高的精准度反复进行吸取、喷射、加热和摇动等操作,处理微小的液体样本。这些机器人通常由化学家编写的电脑程序控制,这些化学家可能在实验室里,也可能在国家的另一端。
而这次,机器人首次由 AI 编写的程序控制。
团队首先让 Coscientist 执行一些简单任务。他们使用一种机器人化学处理设备,让它在一个 96 个小孔的板子上分配彩色液体。Coscientist 收到的指令包括“用你选的颜色隔行上色”和“画一个蓝色对角线”等,类似幼儿园的简单任务。
在初级液体处理技能培训之后,团队又向 Coscientist 介绍了更多类型的机器人设备。他们与 Emerald Cloud Lab 合作,这是一个配备了多种自动化仪器的商业实验室,其中包括分光光度计,这种设备用来测量化学样本吸收的光波长。接着,他们向 Coscientist 展示了一个装有红色、黄色和蓝色三种颜色液体的板子,询问其颜色及位置。
由于 Coscientist 无法“看见”,它编写了代码,将这个神秘的彩色板子自动传递给分光光度计,并分析了每个小孔吸收的光波长。通过这种方式,它确定了板子上的颜色及其位置。在这项任务中,研究人员稍微引导了 Coscientist,让它考虑到不同颜色吸收光线的特性。剩下的工作由 AI 完成。
在 Coscientist 的最终考试中,它需要将自己的模块和所学知识综合运用,来执行一个挑战性的任务:进行“铃木反应 (Suzuki reaction)”和“圣川反应 (Sonogashira reaction)”。这两种反应分别以其发现者铃木章 (Akira Suzuki) 和圣川健吉 (Kenkichi Sonogashira) 的名字命名,都是上世纪 70 年代发现的化学反应。它们利用钯这种金属催化剂,高效地连接有机分子中的碳原子。这些反应不仅对制造治疗炎症、哮喘等疾病的新药至关重要,还广泛应用于智能手机和显示器中的有机半导体 OLED。因其重大贡献,2010 年,铃木章、理查德·赫克 (Richard Heck) 和根岸英一 (Ei-ichi Negishi) 因此共同荣获诺贝尔奖。
对 Coscientist 来说,这是它首次尝试这些复杂的化学反应。为此,它像我编写这篇文章一样,上网查阅了维基百科以学习相关知识。
Coscientist 正在操作一个机器人液体处理器来完成化学实验。
Credit: Carnegie Mellon University
强大的力量,巨大的责任
“当我看到它提出了所有正确的问题时,我就有了‘顿悟’的感觉,”MacKnight 说。他负责设计了一个软件模块,使 Coscientist 能够搜索技术文档。
Coscientist 主要通过维基百科来寻找答案,同时也浏览了包括美国化学会、皇家化学学会等机构的网站,以及描述铃木和 Sonogashira 反应的学术论文。
Coscientist 在短短不到四分钟内,就设计出了一个精确的程序,利用团队提供的化学品成功实现了所需的化学反应。在尝试用机器人在现实世界中实施这一程序时,它在编写控制加热和振荡液体样本的设备的代码时出现了错误。Coscientist 未经人类指示,自行发现并解决了问题,它参考了该设备的技术手册,修正了代码后重新尝试。
最终的结果是几个装着透明液体的小样本。Boiko 对这些样本进行了分析,发现了铃木和 Sonogashira 反应的光谱标志。
当 Boiko 和 MacKnight 告诉 Gomes Coscientist 的所作所为时,Gomes 难以相信。“我当时以为他们在开我的玩笑,”他回忆说。“但事实并非如此。这让我意识到,我们手中拥有的是一些非常新颖、强大的东西。”
这种潜在的力量的出现也带来了使用它的智慧和防止其被滥用的责任。Gomes 表示,理解 AI 的能力和限制是制定明智规则和政策的第一步,这些规则和政策能够有效预防 AI 的有害使用,无论是故意的还是偶然的。
“我们需要负责任且深思熟虑地部署这些技术,”他说。
Gomes 是多位为美国政府提供专家建议和指导的研究人员之一,目的是确保 AI 被安全、可靠地使用,比如 2023 年 10 月拜登政府关于 AI 发展的行政命令。
加速科学发现,使科学普及化
自然界的广阔和复杂性几乎是无边无际的,其中隐藏着数不清的待发现奇迹。试想一下,那些能显著提升能源效率的新型超导材料,或是那些能治疗原本无法治愈的疾病、延长人类寿命的化学化合物。但是,要获得发现这些突破的教育和训练却是一段艰苦且漫长的过程。成为科学家是一件极为不易的事。
Gomes 和他的团队提出了像 Coscientist 这样的 AI 辅助系统的构想。这种系统可以作为一座桥梁,连接广袤未知的自然世界和受过专业训练的科学家的稀缺现状 —— 这种情况可能永远存在。
人类科学家也有自己的生理和心理需求,比如睡眠和偶尔离开实验室。而由人类指导的 AI 则可以实现全天候“思考”,系统地探索每一个可能的角落,反复检验其实验结果,确保可重复性。“我们可以拥有一个能够独立运作,不断探索新现象、新反应、新理念的系统,”Gomes 表示。
“你还可以显著降低进入几乎所有领域的门槛,”他说。例如,一个在 Suzuki 反应(一种有机化学反应)上没有训练的生物学家,如果想探索其在新领域的应用,可以借助 Coscientist 来规划实验。
“这意味着资源和知识的大规模普及化,”他进一步解释。
Gomes 提到,科学中有一个不断尝试、失败、学习和改进的循环过程,AI 可以大幅加速这一过程。“这本身就是一场重大的变革。”