一个新领域有望开创一个利用机器学习和计算机视觉来解决全球生物体生物学问题的新时代。图像组学领域旨在通过将生物体图像与计算机分析和发现相结合,帮助探索有关地球生物过程的基本问题。
俄亥俄州立大学图像组学研究所研究员、俄亥俄州立大学计算机科学与工程包容性卓越工程杰出助理教授赵伟伦上个月在会议上深入介绍了该领域的最新研究进展。美国科学促进会年会。
Chao的AAAS演讲题为“机器学习和计算机视觉的图像组学视角:从微观到全球”,是“图像组学:为理解生物特征提供动力的机器学习”会议的一部分。
赵超和另外两位演讲者描述了图像组学如何通过将研究问题转化为可计算问题来改变社会对生物和生态世界的理解。Chao的演讲重点讨论了图像组学在微观到宏观问题上的潜在应用。
“如今,我们在机器学习和计算机视觉技术方面取得了许多快速进步,”赵说。“如果我们正确使用它们,它们确实可以帮助科学家解决关键但费力的问题。”
虽然一些研究问题可能需要数年或数十年才能手动解决,但图像组学研究人员认为,借助机器和计算机视觉技术(例如模式识别和多模态对齐),可以提高下一代科学发现的速度和效率呈指数级增长。
“如果我们能够将人们几十年和几个世纪以来收集的生物学知识融入机器学习技术中,我们就可以帮助提高他们在可解释性和科学发现方面的能力,”赵说。
Chao和他的同事实现这一目标的方法之一是创建图像组学基础模型,该模型将利用各种来源的数据来实现各种任务。另一种方法是开发能够识别甚至发现特征的机器学习模型,使计算机更容易识别和分类图像中的对象,这就是Chao团队所做的。
“传统的具有特征检测的图像分类方法需要大量的人工注释,但我们的方法不需要,”Chao说。“我们通过生物学家和生态学家如何寻找区分不同生物有机体物种的特征来开发我们的算法。”
传统的基于机器学习的图像分类器通过对整个图像进行分析,然后将其标记为特定的对象类别,从而实现了很高的准确性。然而,Chao的团队采取了更主动的方法:他们的方法教会算法在分析任何图像时主动寻找特定于对象类别(例如其动物物种)的特征,例如颜色和图案。
通过这种方式,图像组学可以为生物学家提供关于图像中揭示的内容和未揭示的内容的更详细说明,为更快、更准确的视觉分析铺平道路。Chao说,最令人兴奋的是,它被证明能够处理非常具有挑战性的细粒度物种的识别任务,例如蝴蝶拟态,其外观的特点是翅膀图案和颜色的细节和多样性。
他说,该算法的易用性还可能使图像组学能够集成到从气候到材料科学研究的各种其他不同目的中。
赵超表示,促进图像组学研究最具挑战性的部分之一是整合科学文化的不同部分,以收集足够的数据并从中形成新颖的科学假设。
他说,这就是为什么不同类型的科学家和学科之间的合作成为该领域不可或缺的一部分的原因之一。图像组学研究将继续发展,但目前,Chao对其以全新的跨学科方式观察和理解自然世界的潜力充满热情。
“我们真正想要的是人工智能与科学知识的紧密结合,我认为图像组学是实现这一目标的一个很好的起点,”他说。