首页 > 生活 > 正文

工程师发现识别人工智能生成文本的新方法

来源:生活2024-04-01 14:54:40
导读 哥伦比亚工程学院的研究人员开发了一种新颖的方法,可以检测人工智能生成的内容,而无需访问人工智能的架构、算法或训练数据,这在该领域尚...

哥伦比亚工程学院的研究人员开发了一种新颖的方法,可以检测人工智能生成的内容,而无需访问人工智能的架构、算法或训练数据,这在该领域尚属首次。

哥伦比亚工程学院的计算机科学家开发了一种用于检测人工智能生成文本的变革性方法。他们的发现有望彻底改变我们验证数字内容的方式,解决围绕大语言模型(LLM)、数字完整性、错误信息和信任日益增加的担忧。

检测人工智能生成文本的创新方法

计算机科学教授JunfengYang和CarlVondrick率先开发了Raidar(通过重写生成AI检测),该技术引入了一种创新方法,用于识别文本是由人类编写还是由AI或ChatGPT等法学硕士生成,而无需访问模型的内部运作。该论文包括开源代码和数据集,将于2024年5月7日至11日在奥地利维也纳举行的国际学习表示会议(ICLR)上发表。

研究人员利用了法学硕士的一个独特特征,他们称之为“顽固性”——法学硕士往往比人工智能生成的文本更容易改变人类编写的文本。发生这种情况是因为法学硕士通常认为人工智能生成的文本已经是最佳的,因此只进行了最小的更改。新方法Raidar使用语言模型来重新措辞或更改给定文本,然后测量系统对给定文本进行的编辑次数。Raidar收到一段文本,例如社交媒体帖子、产品评论或博客文章,然后提示法学硕士重写它。LLM回复重写的文本,Raidar将原始文本与重写的文本进行比较以衡量修改情况。许多编辑意味着文本可能是由人类编写的,而较少的修改意味着文本可能是机器生成的。

Raidar卓越的准确性值得关注——它比以前的方法高出29%。这种性能的飞跃是通过使用最先进的法学硕士重写输入来实现的,无需访问人工智能的架构、算法或训练数据——这在人工智能生成的文本检测领域尚属首次。

即使对于短文本或片段,Raidar也非常准确。这是一个重大突破,因为现有技术需要长文本才能具有良好的准确性。在当今的网络环境中,辨别准确性和检测错误信息尤其重要,社交媒体帖子或互联网评论等简短消息在信息传播中发挥着关键作用,可以对公众舆论和话语产生深远影响。

验证数字内容

在人工智能能力不断扩展的时代,区分人类和机器生成内容的能力对于维护数字平台的完整性和信任至关重要。从社交媒体到新闻文章、学术论文到在线评论,Raidar有望成为打击错误信息传播和确保数字信息可信度的强大工具。

“我们的方法能够准确检测人工智能生成的内容,填补了当前技术的一个关键空白,”该论文的主要作者毛承志(ChengzhiMao)说,他是哥伦比亚工程学院的前博士生,现任杨和冯德里克的博士后。“这不仅令人兴奋;而且令人兴奋。”对于任何重视数字内容完整性以及人工智能不断扩展的能力的社会影响的人来说,这都是至关重要的。”

下一步是什么

该团队计划扩大调查范围,涵盖各种文本领域,包括多语言内容和各种编程语言。他们还在探索机器生成的图像、视频和音频的检测,旨在开发用于跨多种媒体类型识别人工智能生成的内容的综合工具。

关键词:
版权声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

猜你喜欢

最新文章