开发一种新药可能需要数年的研究,花费数百万美元。然而,超过 90% 的候选药物在临床试验中失败,甚至更多药物从未进入临床阶段。许多药物失败是因为它们不安全。
麻省理工学院和哈佛大学布罗德研究所的研究人员开发出了人工智能模型,可以在药物进入生物体之前筛查其潜在的生物学效应。
Srijit Seal 是布罗德成像平台卡彭特-辛格实验室的访问学者,他训练了多个预测机器学习模型,以识别可能对人体造成毒性作用的化学和结构药物特征。
这些工具共同评估了药物如何影响药物开发人员感兴趣的各种结果:一般细胞健康、药代动力学以及心脏和肝功能。截至目前,描述其中三种机器学习工具的论文已发表在《化学信息与建模杂志》、《细胞分子生物学》和《毒理学化学研究》上。第四种正在开发中。
预测模型不会消除实验室实验,但它们可以帮助研究人员缩小潜在药物的选择范围,分配更多的时间和资源来对更有希望的候选药物进行实验。
Seal 开始这项工作是因为想知道是否可以从候选药物的化学结构中获得更多毒理学见解。药物毒性即使在获得 FDA 批准后仍可能是一个问题;药物引起的心脏毒性 (DICT) 和药物引起的肝损伤 (DILI) 都是上市后药物撤回的很大一部分原因。
为了更好地了解药物对人体器官产生毒性的复杂生物学机制,FDA 整理出了药物对心脏和肝脏产生毒性作用的可能性的分类清单。
“自从 FDA 发布这些数据集以来,我们就想知道是否可以使用它们通过机器学习来预测毒性,”Seal 说。
Seal 将这些 FDA 整理的列表用作两个毒性预测机器学习模型的训练数据:一个用于预测心脏毒性,一个用于预测肝损伤。通过输入化学结构、物理化学性质和药代动力学参数,模型学会了识别导致药物毒性的特征。心脏毒性预测器 DICTrank Predictor 是 FDA DICT 排名列表的第一个预测模型。
结构相似的化合物对动物和人类的肝功能的影响往往不同,这就是为什么 DILIPredictor 面临着需要区分不同物种毒性的额外挑战。即使相同的化合物对动物有毒,DILIPredictor 也能正确预测化合物何时对人类安全。
药物开发人员还会评估药代动力学效应,即生物体如何吸收、分布、代谢和清除药物。尽早确定这些特性至关重要:未分布到所需目标的药物无效,而在体内停留时间过长的药物会引起毒性作用。
药代动力学建模既困难又耗时,而且需要昂贵的仪器和软件。预测性机器学习可以为研究人员提供一种“更快失败”的方法,让他们将实验重点放在生物利用度最高的药物上。为了实现这一目标,Seal 一直在与合作者合作开发一种预测性药代动力学建模工具。
“药代动力学领域的机器学习正变得越来越流行,”Seal 说道。“我们想知道我们是否可以设计一个预测模型并将其与行业模型进行比较,至少目前可以作为概念验证。
“药物设计需要某种反馈回路,以确保你设计的药物确实能在人体中发挥作用,而不会产生意想不到的毒性,”他补充道。这套预测机器学习工具如果应用于早期药物研发,可以为该回路提供框架。
药物毒理学的另一个方面与细胞健康有关。当机器学习模型预测化合物的潜在影响时,研究人员通常希望获得更多细节,例如化合物影响细胞的机制。Seal 随后转向 CellProfiler 提取的特征,CellProfiler 是一款用于解释细胞形态特征的开源成像软件。
“CellProfiler 将细胞的物理特征视为基于图像数据,并试图预测它们相对于对照的变化情况,”Seal 解释道。“当我们询问行业生物学家他们如何使用 CellProfiler 数据时,他们告诉我们,有时他们不知道如何在生物学背景下解释这些基于图像的特征。”
为了使 CellProfiler 数据更具生物学可解释性,Seal 开发了 BioMorph,这是一种深度学习模型,它将 CellProfiler 的图像数据与细胞健康数据(例如细胞生长和繁殖的速度)相结合。
使用两个互补数据集进行训练,BioMorph 可以推断特定化合物的作用机制如何影响细胞健康。当使用训练集之外的数据测试 BioMorph 时,该模型可以正确地将化合物与受该特定化合物影响的细胞特征进行匹配。
“BioMorph 提供了更多细节,科学家可以从生物学角度阅读和理解,”Seal 说道。“我们期待听到人们对使用 BioMorph 进行个人测试的反馈。”