在比您阅读本文所需的时间更短的时间内,人工智能驱动的系统能够自主了解某些获得诺贝尔奖的化学反应,并设计出成功的实验室程序来制造它们。人工智能在短短几分钟内就完成了这一切,并且一次尝试就成功了。
卡内基梅隆大学化学家兼化学工程师加布·戈麦斯(GabeGomes)领导了组装和测试人工智能的研究小组,他说:“这是第一次非有机智能计划、设计和执行了人类发明的这种复杂反应。”为基础的系统。他们将自己的创作称为“Coscientist”。
Coscientist完成的最复杂的反应在有机化学中被称为钯催化交叉偶联,该反应的人类发明者获得了2010年诺贝尔化学奖,以表彰这些反应在药物开发过程和其他行业中发挥的巨大作用。使用挑剔的碳基分子。
发表在《自然》杂志上的Coscientist所展示的能力表明,人类有潜力有效地利用人工智能来加快科学发现的速度和数量,并提高实验结果的可重复性和可靠性。
这个四人研究团队包括博士生DaniilBoiko和RobertMacKnight,他们分别得到了美国国家科学基金会西北大学化学酶合成中心和圣母大学NSF计算机辅助合成中心的支持和培训。
“除了他们的系统演示的化学合成任务之外,戈麦斯和他的团队还成功合成了一种超高效的实验室伙伴,”美国国家科学基金会化学部主任戴维·伯科维茨(DavidBerkowitz)说。“他们把所有的部分放在一起,最终的结果远远超过各个部分的总和——它可以用于真正有用的科学目的。”
卡内基梅隆大学的研究人员在12月21日出版的《自然》杂志上报告称,一种非有机智能系统首次设计、规划并执行了化学实验。图片来源:卡内基梅隆大学
将Coscientist放在一起
Coscientist的软件和硅基部件中最主要的是构成其人工“大脑”的大型语言模型。大型语言模型是一种人工智能,可以从大量数据(包括文档中包含的书面文本)中提取含义和模式。
通过一系列任务,团队测试并比较了多个大语言模型,包括GPT-4以及OpenAI公司制作的GPT大语言模型的其他版本。
Coscientist还配备了几个不同的软件模块,团队首先对这些模块进行单独测试,然后进行协同测试。
“我们试图将科学中所有可能的任务分成小部分,然后逐个构建更大的图景,”设计Coscientist总体架构及其实验任务的Boiko说。“最后,我们把一切都整合到了一起。”
这些软件模块使Coscientist能够做所有研究化学家都会做的事情:搜索有关化合物的公共信息,查找并阅读有关如何控制机器人实验室设备的技术手册,编写计算机代码来进行实验,并分析结果数据以确定什么什么有效,什么无效。
一项测试检验了Coscientist准确规划化学程序的能力,如果执行该程序,将产生阿司匹林、对乙酰氨基酚和布洛芬等常用物质。对大型语言模型进行了单独测试和比较,其中包括两个版本的GPT,其软件模块允许它像人类化学家一样使用Google在互联网上搜索信息。
然后对最终的程序进行检查,并根据它们是否会产生所需的物质、步骤的详细程度以及其他因素进行评分。一些最高分是由支持搜索的GPT-4模块获得的,该模块是唯一一个创建了可接受质量的布洛芬合成程序的模块。
博伊科和麦克奈特观察到Coscientist展示了“化学推理”,博伊科将其描述为使用化学相关信息和先前获得的知识来指导自己行动的能力。它使用以简化分子输入线输入系统(SMILES)格式(一种代表分子化学结构的机器可读符号)编码的公开化学信息,并根据分子的特定部分对其实验计划进行了更改仔细检查SMILES数据。
“这是化学推理的最佳版本,”博伊科说。
进一步的测试纳入了软件模块,允许Coscientist搜索和使用描述控制机器人实验室设备的应用程序编程接口的技术文档。这些测试对于确定Coscientist能否将其合成化合物的理论计划转化为指导物理世界中的实验室机器人的计算机代码非常重要。
引进机器人
高科技机器人化学设备通常在实验室中使用,以精确的精度一遍又一遍地吸取、喷射、加热、摇动微小的液体样品以及执行其他操作。此类机器人通常通过人类化学家编写的计算机代码进行控制,这些化学家可能在同一个实验室,也可能在国家的另一边。
这是此类机器人首次由人工智能编写的计算机代码控制。
该团队以简单的任务启动Coscientist,要求其使用机器人液体处理机将有色液体分配到包含96个网格排列的小孔的板中。它被告知“用你选择的一种颜色为每条线涂上颜色”、“画一条蓝色对角线”以及其他让人想起幼儿园的作业。
从液体处理机101毕业后,该团队向Coscientist介绍了更多类型的机器人设备。他们与EmeraldCloudLab合作,这是一家商业设施,配备了各种自动化仪器,包括分光光度计,用于测量化学样品吸收的光的波长。然后向科学家展示一个含有三种不同颜色(红色、黄色和蓝色)液体的盘子,并要求其确定存在哪些颜色以及它们在盘子上的位置。
由于Coscientist没有眼睛,它编写代码自动将神秘色板传递到分光光度计,并分析每个孔吸收的光的波长,从而识别存在哪些颜色及其在色板上的位置。对于这项任务,研究人员必须在正确的方向上稍微推动Coscientist,指示它思考不同颜色如何吸收光线。人工智能完成了剩下的工作。
Coscientist的期末考试是将其组装的模块和训练放在一起,以履行团队的命令“执行铃木和园头反应”,该反应以发明者AkiraSuzuki和KenkichiSonogashira的名字命名。
该反应发现于20世纪70年代,利用金属钯催化有机分子中碳原子之间的键。事实证明,这些反应对于生产治疗炎症、哮喘和其他疾病的新型药物非常有用。它们还用于许多智能手机和显示器中OLED的有机半导体。2010年,Sukuzi、RichardHeck和Ei-ichiNegishi联合获得诺贝尔奖,正式认可了这些突破性反应及其广泛影响。
当然,Coscientist以前从未尝试过这些反应。因此,正如作者在写前一段时所做的那样,他去了维基百科并查找了它们。
权力大、责任大
“对我来说,‘顿悟’时刻就是看到它提出了所有正确的问题,”MacKnight说道,他设计了允许Coscientist搜索技术文档的软件模块。
Coscientist主要在维基百科以及许多其他网站上寻找答案,包括美国化学会、英国皇家化学会和其他包含描述铃木反应和园头反应的学术论文的网站。
在不到四分钟的时间里,Coscientist设计了一个精确的程序,使用团队提供的化学品产生所需的反应。当它试图用机器人在现实世界中执行其程序时,它在为控制加热和摇动液体样本的设备而编写的代码中犯了一个错误。在没有人类提示的情况下,Coscientist发现了问题,查阅了设备的技术手册,更正了代码并再次尝试。
结果包含在一些透明液体的微小样本中。博伊科分析了样品,发现了铃木反应和园头反应的光谱特征。
当博伊科和麦克奈特告诉戈麦斯Coscientist的所作所为时,戈麦斯感到难以置信。“我以为他们在开我的玩笑,”他回忆道。“但他们不是。他们绝对不是。就在那时,我们意识到,好吧,我们这里有一些非常新、非常强大的东西。”
有了这种潜在的力量,就需要明智地使用它并防止滥用。戈麦斯表示,了解人工智能的能力和局限性是制定明智的规则和政策的第一步,这些规则和政策可以有效防止人工智能的有害使用,无论是有意还是无意。
“我们需要对如何部署这些技术负责并深思熟虑,”他说。
戈麦斯是为美国政府确保安全可靠地使用人工智能的努力提供专家建议和指导的几位研究人员之一,例如政府2023年10月关于人工智能开发的行政命令。
加速发现,使科学民主化
自然世界的规模和复杂性实际上是无限的,其中蕴藏着无数的发现等待着我们去发现。想象一下新的超导材料可以显着提高能源效率,或者可以治愈其他无法治疗的疾病并延长人类寿命的化合物。然而,获得实现这些突破所需的教育和培训是一个漫长而艰巨的旅程。成为一名科学家很难。
Gomes和他的团队设想像Coscientist这样的人工智能辅助系统作为一种解决方案,可以弥合未经探索的浩瀚自然与训练有素的科学家短缺(而且可能永远如此)之间的差距。
人类科学家也有人类的需求,比如睡觉和偶尔走出实验室。而人类引导的人工智能可以全天候“思考”,有条不紊地翻转每一个众所周知的石头,检查并重新检查其实验结果的可复制性。“我们可以拥有可以自主运行的东西,试图发现新现象、新反应、新想法,”戈麦斯说。
“你还可以显着降低基本上任何领域的进入门槛,”他说。例如,如果未受过铃木反应培训的生物学家想要以新的方式探索其用途,他们可以要求Coscientist帮助他们计划实验。
“你可以实现资源和理解的大规模民主化,”他解释道。
戈麦斯说,科学中有一个尝试、失败、学习和改进的迭代过程,人工智能可以大大加速这个过程。“这本身将是一个巨大的变化。”