GPT-4自我批评？CriticGPT模型震撼发布！

9146

财联社6月28日讯（编辑周子意）据OpenAI于周四（6月27日）发布的新闻稿，该公司推出了一款新的基于GPT-4的模型——CriticGPT，该模型旨在发现ChatGPT代码输出中的错误。

CriticGPT的作用类似于让人们利用GPT-4查找GPT-4中存在的错误。该模型可以对ChatGPT的响应结果做出批评性的评论，帮助人工智能训练师在“基于人类反馈的强化学习（RLHF）”过程中发现错误，从而为人工智能训练师提供明确的人工智能协助。

这款新模型的发布旨在向投资者传达OpenAI在RLHF领域的领先地位。RLHF的关键环节之一是收集对比，以便人工智能训练师对不同的ChatGPT回答进行评分并反馈给ChatGPT。

研究表明，训练师在使用CriticGPT审查ChatGPT输出代码时，其表现比未获得帮助的训练师高出60%。在CriticGPT的帮助下，训练师的指正比他们单独指正时更加全面。

随着大模型在推理和行为方面取得进展，ChatGPT变得更加准确，但其错误变得更加微妙。这可能使人工智能训练师难以发现其中的不准确之处，进而增加RLHF对比任务的难度。如果没有更好的工具，人们很难对这些系统进行评估。

OpenAI指出，CriticGPT模型将能够评估先进人工智能系统的输出。OpenAI举了一个例子：用户要求ChatGPT“用Python编写指定函数”，ChatGPT根据指令给出了代码。对于ChatGPT给出的代码，CriticGPT对其中一条代码进行了评论，并给出了效果更好的替代方案。

还有数据显示，在OpenAI的实验中，随机训练师在超过60%的时间里更倾向于人类与CriticGPT合作后得出的指正，而不是单纯由人类训练师作出的批评。OpenAI也指出，CriticGPT的建议并不总是正确的，但与没有人工智能帮助相比，它可以帮助训练师找出模型中的更多问题。

本网站的文章部分内容可能来源于网络和网友发布，仅供大家学习与参考，如有侵权，请联系站长进行删除处理，不代表本网站立场，转载者并注明出处：https://www.jmbhsh.com/xingyeremen/29777.html