首页 > 生活 > 正文

基于提示的新技术可增强人工智能安全性

来源:生活2024-06-25 16:54:06
导读 研究人员开发了一种新的人工智能安全方法,该方法利用文本提示来更好地保护人工智能系统免受网络威胁。该方法侧重于创建对抗性示例,以防止...

研究人员开发了一种新的人工智能安全方法,该方法利用文本提示来更好地保护人工智能系统免受网络威胁。该方法侧重于创建对抗性示例,以防止人工智能被人类通常无法察觉的输入误导。

基于提示的技术简化了这些对抗性输入的生成,无需大量计算即可更快地响应潜在威胁。初步测试表明,这种方法可以有效地保护人工智能响应,同时尽量减少与人工智能系统的直接交互。

首席研究员马飞飞博士概述了这一过程:“我们的方法首先是制作恶意提示来识别人工智能模型中的漏洞。识别之后,这些提示被用作训练数据,帮助人工智能在未来抵御类似的攻击。”

后续实验表明,这种训练方法提高了人工智能系统的稳健性。使用对抗性提示训练的模型不太可能屈服于类似的攻击,这表明其防御能力得到了增强。

马博士指出:“这种方法使我们能够发现并减轻人工智能模型中的漏洞,这在金融和医疗保健等领域尤为重要。”

这项发表在《计算机科学前沿》上的研究表明,经过这些对抗提示训练的人工智能系统将来更有能力抵抗类似的操纵策略,从而有可能提高其抵御网络威胁的整体能力。

这是中国科学院、中国科学院大学、斯坦福大学和新加坡国立大学的合作成果。

关键词:
版权声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

猜你喜欢

最新文章