导读 斯坦福大学的人工智能研究人员与NotbadAIInc.合作开发了一种算法,允许当前的聊天机器人在给出最终答案之前仔细考虑对查询的可能响应。该团...
斯坦福大学的人工智能研究人员与NotbadAIInc.合作开发了一种算法,允许当前的聊天机器人在给出最终答案之前仔细考虑对查询的可能响应。该团队在arXiv预印本服务器上发表了一篇论文,描述了他们的新方法以及他们的算法与现有聊天机器人配合使用时的效果如何。
正如研究人员指出的那样,当前聊天机器人采用的一般方法是使用训练数据来回答人类提出的问题。目前公众使用的聊天机器人在给出它认为最有可能是人类想要的答案之前,都不会停下来思考一个问题的多种可能答案。如果一个人以这样的方式回应,那就会被描述为简单地脱口而出答案。
在这项新研究中,研究团队为聊天机器人提供了一种在回答之前进行思考的方法,并声称创造了一种让聊天机器人更加准确并以更类似于人类的方式回答问题的方法。
Quiet-STaR算法的工作原理是首先要求聊天机器人针对给定的查询生成多个答案。它将答案与原始查询进行比较,以确定哪个似乎是最好的。然后它指示聊天机器人将该答案返回给用户。该团队还赋予算法从自身工作中学习的能力,从而随着时间的推移提高其思考能力。
为了测试他们的算法,研究人员将其添加到开源Mistral7B聊天机器人中,并使用标准推理测试对其进行了测试-得分为47.2%。如果没有该算法,Mistral7B的得分仅为36.3%。它在数学测试中也表现得更好。
研究团队指出,他们的算法可以插入当前使用的任何聊天机器人中,尽管这必须由其制造商完成,他们建议此举可以提高聊天机器人的总体准确性。