1. 首页 > 头条 > 行业热门

GPT-4自我批评?CriticGPT模型震撼发布!

9146

财联社6月28日讯(编辑 周子意)据OpenAI于周四(6月27日)发布的新闻稿,该公司推出了一款新的基于GPT-4的模型——CriticGPT,该模型旨在发现ChatGPT代码输出中的错误。

CriticGPT的作用类似于让人们利用GPT-4查找GPT-4中存在的错误。该模型可以对ChatGPT的响应结果做出批评性的评论,帮助人工智能训练师在“基于人类反馈的强化学习(RLHF)”过程中发现错误,从而为人工智能训练师提供明确的人工智能协助。

这款新模型的发布旨在向投资者传达OpenAI在RLHF领域的领先地位。RLHF的关键环节之一是收集对比,以便人工智能训练师对不同的ChatGPT回答进行评分并反馈给ChatGPT。

研究表明,训练师在使用CriticGPT审查ChatGPT输出代码时,其表现比未获得帮助的训练师高出60%。在CriticGPT的帮助下,训练师的指正比他们单独指正时更加全面。

随着大模型在推理和行为方面取得进展,ChatGPT变得更加准确,但其错误变得更加微妙。这可能使人工智能训练师难以发现其中的不准确之处,进而增加RLHF对比任务的难度。如果没有更好的工具,人们很难对这些系统进行评估。

OpenAI指出,CriticGPT模型将能够评估先进人工智能系统的输出。OpenAI举了一个例子:用户要求ChatGPT“用Python编写指定函数”,ChatGPT根据指令给出了代码。对于ChatGPT给出的代码,CriticGPT对其中一条代码进行了评论,并给出了效果更好的替代方案。

还有数据显示,在OpenAI的实验中,随机训练师在超过60%的时间里更倾向于人类与CriticGPT合作后得出的指正,而不是单纯由人类训练师作出的批评。OpenAI也指出,CriticGPT的建议并不总是正确的,但与没有人工智能帮助相比,它可以帮助训练师找出模型中的更多问题。

本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载者并注明出处:https://www.jmbhsh.com/xingyeremen/29777.html

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息